@UEBER LINIEN = Lycos, Alta Vista, WebCrawler Wie fast alle Internet-Suchmaschinen sind Lycos, Alta Vista und WebCrawler in den USA beheimatet und vom Ursprung her klassische Search Engines. Sie bestehen aus drei wesentlichen Modulen: @BODY BLICK 1 = <%-2>einem Agentenprogramm (auch als Roboter, Searcher<%0> oder Gatherer bezeichnet), das laufend die Informationen aus dem Internet zusammenträgt. Im Vordergrund steht heute vor allem die Auswertung von WWW-Servern, d<%-2>ie HTML-Dokumente enthalten, zusätzlich werden aber auch FTP- und Gopher-Server abgefragt. <%0> @BODY BLICK 1 = hinzu kommt ein Datenbanksystem, das die von den Agenten angelieferten Dokumente indexiert und verwaltet. Es ist ein verbreiteter Irrtum, Suchmaschinen würden in Echtzeit das Internet durchsuchen, wenn sie eine Suchanfrage bearbeiten. @BODY BLICK 1 = zuletzt noch eine Benutzerschnittstelle, die Suchanfragen entgegennimmt und Dokumente zurückgibt. Indexbrowsing, hierarchisches Suchen oder Nutzung irgendeiner Klassifikation ist mit diesen Tools nicht vorgesehen, obschon in Lycos solche Ansätze neuerdings verfolgt werden. Es ist relativ einfach, ein Agentenprogramm zu schreiben und dazu ein primitives Auswertprogramm für die gesammelten Daten zu erstellen. Der Betrieb professioneller Suchmaschinen stellt aber ganz andere Anforderungen. Um nur einige Problembereiche zu benennen: @BODY BLICK 1 = Wie findet der Agent HTML-Dokumente im Internet mit annähernder Vollständigkeit? Ein üblicher Lösungsansatz geht von der Auswertung der Hyperlinks aus, die die einzelnen HTML-Dokumente verweben - dem Spezifikum des World Wide Web. Seiten, die nicht referenziert sind, können dabei allerdings nicht erschlossen werden. Andere Fragestellungen sind: @BODY BLICK 1 = Wie häufig müssen die Datenbankeinträge aktualisiert werden? @BODY BLICK 1 = Wie geht man mit "toten" Servern um? Wurde der Server eingestellt oder wird gerade nur die Maschine gewartet? @BODY BLICK 1 = Auf der Datenbankseite stellen die Bereitstellung und Verwaltung der riesigen Datenmengen große Anforderungen an Hard- und Software. Um einige Zahlen zu nennen: Das Alta Vista-System benötigt für sein Datenbanksystem einen Multiprozessorrechner mit 10 Alpha-Chips, ausgestattet mit 210 GB Plattenspeicher und 6 GB RAM. Das zugehörige Agentensystem Scooter läuft auf einem Alpharechner mit 30 GB Platten- und 1 GB Hauptspeicher; hinzukommt noch ein ähnlich üppig ausgestatteter Kommunikationsrechner. @BODY BLICK 1 = Bei der Datenaufbereitung ist man mit den bekannten Problemen des Volltextretrieval in sehr großen, inhomogenen Datenbeständen konfrontiert. Theoretisch sind alle Textdokumente, die mit HTML kodiert sind, sauber strukturiert, da HTML ein SGML-Derivat ist, und SGML bekanntlich gerade für diesen Zweck entworfen wurde. In der Praxis werden die SGML bzw. HTML-Konventionen bei WWW-Seiten häufig nicht eingehalten, zumal viele WWW-Browser sehr fehlertolerant sind und auch mangelhaftes HTML korrekt darstellen. Dies wiederum fördert bei den Autoren eine Nachlässigkeit bezüglich der sauberen Strukturierung der Dokumente. @BODY BLICK 1 = Ein weiteres Problem stellt die zwangsläufige Multilingualität eines weltweiten Indexes dar. Zudem sollten neben Texten auch Bilder, Graphiken und Videosequenzen erschlossen werden. @BODY BLICK 1 = <%-2>Zuletzt muß die Benutzerschnittstelle so angelegt sein, daß sie für den gelegentlichen, im Umgang mit kom<%-1>plexen bibliographischen Retrievaltechniken ungeschulten Endnutzer tauglich ist. Die derzeitige Standardlösung ist, daß man über WWW eine auf HTML-Forms <%0>basierende Suchmaske anbietet, in die der Benutzer einen oder mehrere Suchbegriffe einträgt und die Suchmaschine ihm @BODY VORN = eine Liste von Treffern zurückgibt. Der Betrieb einer Internetsuchmaschine stellt also eine anspruchsvolle Aufgabe dar, die bereits heute nur unzureichend bewältigt werden kann. Die Aufgabe ist vergleichbar mit dem Versuch, den Bestand einer Bibliothek vollautomatisch durch Einscannen von beispielsweise der ersten 5 Seiten jeden vorhandenen Dokumentes und anschließender Indexierung zu erschließen. Ob der bisher verfolgte Ansatz, einfach alle vorhandenen Seiten zu indexieren, mit dem weiteren Wachstum des World Wide Web überhaupt noch durchzuhalten ist, darf bezweifelt werden. Angesichts dieser Schwierigkeiten ist die Leistungsfähigkeit der heute vorhandenen Suchmaschinen doch sehr beeindruckend, ungeachtet der Kritikpunkte, die bei der Darstellung der einzelnen Systeme zur Sprache kommen werden. @UEBER LINIEN = Lycos (http://www.lycos.com) @BODY VORN = Allgemeines Lycos wurde von Michael Mauldin (Spitzname "Fuzzy") entwickelt, damals noch Mitarbeiter am Zentrum für Machine Translation an der Carnegie Mellon University. Der Name leitet sich übrigens von der lateinischen Bezeichnung für die Familie der Wolfs- oder Vogelspinnen ab. Lycos wurde im Juni 1994 erstmals angeboten, bereits ein Jahr später als Lycos Inc. privatisiert. Lycos ist eine der bekanntesten WWW-Suchmaschinen und die Firma Lycos Inc. finanziert sich heute fast ausschließlich durch Werbeanzeigen; daneben durch die Lizensierung des Lycos-Kataloges an Firmen, die zum Beispiel wegen Firewalls nicht direkt auf das Internet zugreifen. Die Idee, die Recherchen oder die Aufnahme von Dokumenten in Lycos kostenpflichtig zu machen, die Michael Mauldin 1995 auf der Internationalen WWW-Konferenz in Darmstadt vertrat, wird offenbar nicht weiterverfolgt; die Recherche ist nach wie vor kostenlos. Inzwischen hat die Firma Microsoft Lycos lizensiert. @BODY VORN = Umfang und Inhalt der Datenbank Die Lycos-Datenbank enthält nach eigenen Angaben ca. 30 Mio. URLs (Stand 1.3.1996, im November 1995 waren es noch 11 Mio. URLs), damit sollen 90% des WWW erschlossen sein. Nach eigenen Angaben erhält Lycos ca. 30 Mio. Anfragen pro Monat, die Datenbank wird jedes Wochenende aktualisiert. 20 Mio. URLs bedeutet allerdings nicht 20 Mio. unterschiedliche Dokumente, da die in den einzelnen WWW-Seiten enthaltenen Links mitgezählt werden. Die Zahlenangaben sind also sehr mit Skepsis zu betrachten, zumal Lycos als kommerzielles Unternehmen sehr auf Selbstdarstellung bedacht ist, um als Werbeträger attraktiv zu sein. Das Agentensystem von Lycos wertet WWW-, Gopher- und FTP-Server aus. @BODY VORN = Suchmöglichkeiten Die Einstiegsmaske von Lycos bietet ein einziges Eingabefeld, in dem ein oder mehrere Stichworte eingegeben werden können. Mehrere Suchbegriffe werden dabei standardmäßig mit "OR" verknüpft und automatisch rechtstrunkiert. Mit einem Punkt (".") kann die Rechtstrunkierung ausgeschaltet werden. Alternativ zur Einstiegsmaske wird eine "Enhanced Query" angeboten. In dieser Maske kann zusätzlich eine "AND"-Verknüpfung vorgenommen werden durch Auswahl der Option "match all terms". Zudem kann eine kombinierte "AND OR" Suche eingestellt werden: "match 2 terms" <%-2>erzeugt die Suchanfrage: "mueller <> mueller<%0> <> test". Ein Boolsches "NOT" ist nicht vorgesehen. Man soll laut Hilfe durch Eingabe eines Minus ("-") vor dem unerwünschten Begriff dessen Wertigkeit so erniedrigen können, daß die entsprechenden Treffer nicht mehr angezeigt werden. Nach meiner Erfahrung funktioniert dies jedoch nicht. Eine weitere Einschränkung der Suche ist möglich über die Veränderung der "search options". Dabei gilt für die Trefferanzahl: Loose (def.) >>fair>>good>>close>> strong match, d.h. am meisten Treffer erhält man mit "loose match", am wenigstens mit "strong match". Die dabei verwendete Technik ist mir nicht bekannt. @BODY VORN = Stoppworte, Sonderzeichen Lycos kennt Stoppworte, z.B. "of" und "the", deutsche Artikel zählen jedoch nicht dazu. Bei der Trefferanzeige werden die Stoppworte als solche gekennzeichnet. Sonderzeichen können in der Regel nicht gesucht werden, wie z.B. das "plus" in "C++". Ebenso Worte, die mit Zahlen beginnen: "3DGraphik" kann nur unter "DGraphik" gesucht werden. Deutsche Umlaute wurden bis vor kurzem als Leerzeichen interpretiert: Schülerzeitung wird als "sch" und "lerzeitung" gesucht, Bäume als "ume", da "m" ein Stoppwort ist. Das war der Stand im Februar 1996. Jetzt ist es anscheinend so, daß "ae" (baeume) und "ue" (schuelerzeitung) korrekt gesucht werden, bei "oe" (erdoel) scheint es noch Schwierigkeiten zu geben. Das Auflösen der Umlaute im Suchbegriff ist nicht zu empfehlen, da in diesem Fall nur Dokumente gefunden werden, die Umlaute in aufgelöster Form enthalten. @BODY VORN = Präsentation der Suchergebnisse Standardmäßig werden bei Lycos die ersten 10 Treffer angezeigt. Lycos gibt in der Trefferliste an, wieviele Dokumente insgesamt gefunden wurden, die einen der Suchterme enthalten. Als anklickbare Hyperlinks werden zudem die einzelnen Suchbegriffe angegeben, ein angenehmes Feature. Die Dokumente werden in der Reihenfolge ihrer Wertigkeit (ranking factor) angezeigt. Der ranking factor leitet sich ab von der Häufigkeit des Vorkommens des Suchbegriffes im Dokument und der Stellung des Suchbegriffes im HTML-Dokument: je weiter am Anfang, <%-3>desto höher die Wertigkeit. <%-2>Außer-<%-3>dem f<%0>ließt die Genauigkeit ein, mit der der Suchbegriff vorkommt: untrunkierte Form vor trunkierter usw., sowie die Anzahl der Hyperlinks des Dokuments. Der Abstract wird aus den sinntragenden Begriffen der HTML-Dokumente gebildet. Dies sind die URLs, das Title field, die ersten 200 Zeichen im header field, die 100 statistisch gewichtigsten Begriffe im Dokument und bis zu 20 Zeilen Hyperlink-Text sowie die ersten 20 Zeilen oder 20 % des Dokuments (Excerpt). Angezeigt wird im Standardformat der Titel (als Hyperlink), in eckigen Klammern der ranking factor, ein Abstract plus URL plus Größe des Dokuments. Über die Enhanced Search-Maske können Parameter der Anzeige verändert werden, z. B. die Anzahl der Treffer auf bis zu 40 erhöht und verschiedene Formate eingestellt werden: @BODY BLICK 1 = Summary: nur die Titles (als Hyperlink) plus ranking factor werden gezeigt. @BODY BLICK 1 = <%-2>Detailed: zusätzlich werden die Anzahl der "matched terms",<%0> die "words matched in page" und die Anzahl der Hyperlinks in der Seite angegeben. Ferner wird das letzte Änderungsdatum der HTML-Seite, die Anzahl der Bytes und die Anzahl der Worte angegeben. Man sollte wegen des höheren Informationsgehaltes stets das "detailed format" wählen. @BODY VORN = Sonstiges Zur Geschwindigkeit ist zu sagen, daß Lycos in der Regel ziemlich schnell arbeitet. Es ist nach meinem Eindruck zusammen mit dem WebCrawler die schnellste der vorgestellten Suchmaschinen. Lycos bietet seit neuestem auch die Möglichkeit einer hierarchischen Suche. Dies ist realisiert in einer Liste "a to z", die eine Grobeinteilung der Wissensgebiete in einer Baumstruktur anbietet. Bei den Trefferlisten von "a to z" gibt es einen Link "most popular". Dies ist wohl das Relikt der alten "Lycos 250"-Liste, die durch Auswertung der Anzahl von Hyperlinks, die auf die Seiten zeigen, entstand. Zudem bietet Lycos eine Untermenge der "a to z"-Struktur an, namens Point 5 %. In diesem Baum sollen nur qualitätsgeprüfte Seiten mit besonders wertvollen Informationen enthalten sein. Diese Aussage konnte ich aber bislang nicht nachvollziehen, mir scheint hier eher der Wunsch der Lycos Inc. nach zusätzlichen Werbeeinnahmen im Vordergrund zu stehen. Durch Anklicken von "Why search when you can find?" im Lycos-Eingangsbildschirm erhält man ein Eingabefenster für die drei Strukturen. Die Trefferlisten enthalten bei A2Z Links auf verwandte Gebiete. Die Treffer der A2Z search enthalten einen Link auf das entsprechende Sachgebiet. Die Pointsearch Listen sind dagegen ziemlich unübersichtlich. Außerdem besteht die Möglichkeit, URLs bei Lycos an- und abzumelden. Ob die Austragung von URLs aus der Datenbank noch immer manuell geschieht, wie dies vor einem Jahr der Fall war, ist mir nicht bekannt. Man kann es ja ausprobieren und eine WWW-Seite, die schon immer gestört hat, bei Lycos abmelden. Zuletzt ist noch festzuhalten, daß über Lycos auch eine Suche auf FTP-Servern möglich ist. @BODY VORN = Bewertung Positiv bei Lycos sind die Vollständigkeit der Datenbank, die Geschwindigkeit und die ausführliche Angaben in den Trefferlisten. Nachteilig macht sich bemerkbar, daß der Aufbau der Ergebnislisten praktisch nicht nachvollziehbar ist: man erhält in der Regel neben dem gewünschten Resultat eine Anzahl völlig unerwünschter Treffer. Nachteilig ist auch, daß die Möglichkeiten, die Suche einzuschränken, ziemlich begrenzt sind. @UEBER LINIEN = Alta Vista (http://altavista.digital.com) @BODY VORN = Allgemeines Alta Vista ist ein ganz neues System, es wird von der Digital Equipment Company (DEC) in Palo Alto seit dem 15. Dezember 1995 angeboten. Laut eigener Angaben befindet sich der Betrieb noch im BetaStadium. @BODY VORN = Umfang der Datenbank Alta Vista unterhält zwei Datenbanken: eine Datenbank mit WWW-Informationen und eine mit Artikeln aus Usenet-Newsgruppen. Der Umfang der WWW-Datenbank beträgt ca. 22 Mio. WWW-Seiten. Eigenen Angaben zufolge sind das 50% der zur Zeit weltweit ca. 45 Mio. WWW-Seiten. Eine Besonderheit ist, daß der Index laufend im Betrieb upgedatet wird, wobei eine Erfassungsleistung von ca. 3 Mio. Seiten pro Tag möglich sein soll. @BODY VORN = Ausgewertete Quellen @BODY VORN = Es wird die gesamte WWW-Information ausgewertet, ebenso FTP-Server. Die Aktualisierung läuft so, daß neuere HTML-Seiten (mit jüngerem Datum) häufiger akualisiert werden als alte Seiten. @BODY VORN = @BODY VORN = Suchmöglichkeiten @BODY VORN = Die große Stärke von Alta Vista ist die große Anzahl angebotener Suchoptionen. Es werden zwei Suchmodi angeboten: "Simple Query" und "Advanced Query". Bei beiden Modi können Boolsche Operatoren verwendet werden. In der "Advanced Query" müssen sie im Klartext eingegeben werden: "and", "or", "not" und "near", in der "Simple Query" werden Zeichen verwendet: "+" für AND, <> für OR, "-" für NOT. Vor den Operatoren muß jeweils ein Blank stehen. Default bei der "Simple Query" ist "OR", eine automatische Trunkierung findet nicht statt. Bei der "Advanced Query" kann zudem anhand des Änderungsdatums des Dokuments der Zeitraum eingeschränkt werden. Ferner kann die Präsentation der Ergebnisse beeinflußt werden: es können Begriffe vorgegeben werden, die Dokumente enthalten, die an oberer Position in der Trefferliste stehen sollen. So erfreulich die Möglichkeit des Einsatzes aller Boolscher Operatoren auf den ersten Blick auch ist, so erweist sich ihre Verwendung in der Praxis doch als problematisch. Es ist ein grundsätzliches Problem, daß bei Volltextretrieval Boolsche Operatoren nur begrenzt tauglich sind. Man muß sich deshalb fragen, ob es sinnvoll ist, eine elaborierte Suchanfrage auf einen unstrukturierten Suchraum wie ihn die Gesamtheit alller HTML-Dokumente darstellt, anzuwenden? Bei der Verwendung von "+" bzw. AND zeigt sich zudem, daß dies keinen allzu großen Einfluß auf die Ergebnisse hat: "michael mnnich" findet genauso die gewünschten Dokumente wie "+michael +mnnich", nur der Ballast ist leicht unterschiedlich. @BODY VORN = Feldbegrenzung Die Suche kann bei Alta Vista außerdem noch auf bestimmte Bereiche von WWW-Dokumenten eingeschränkt werden, nämlich: URL:, TITLE:, HOST:, LINK:, TEXT:. Weitere Bereichseinschränkungen sind vorgesehen. Bei der URL- und LINK-Suche wird automatisch rechts- und linkstrunkiert (z.B. "url:ubka"). LINK ist ein hübsches feature, denn man kann so nachsehen, wer die eigene Seite gelinkt hat. Die Suche auf "TEXT:" beschränkt sich auf den anzeigbaren Teil der Seiten, Kommentare im HTML werden ignoriert. @BODY VORN = Phrasensuche, Sonderzeichen, Trunkierung @BODY VORN = Eine Phrasensuche kann mit Gänsefüßchen erzwungen werden: "string string string". Sonderzeichen werden wie bei Lycos in der Regel als Leerzeichen interpretiert. Deutsche Umlaute hingegen können bei Alta Vista anscheinend gesucht werden, wobei das manchmal wechselt (sic!). Eigenwillig ist die Interpretation von Groß- und Kleinbuchstaben in den Suchbegriffen sowie die Trunkierung: in Kleinbuchstaben in der Suchanfrage findet man auch Großbuchstaben, aber ein Suchbegriff, der Großbuchstaben enthält, findet nur die exakt gleiche Schreibweise. Man sollte also immer nur Kleinbuchstaben verwenden. Eine Rechtstrunkierung erzielt man mit "*", wobei mindestens drei Buchstaben vorausgehen müssen. Die Trunkierung deckt jedoch nur maximal fünf Zeichen ab! Und diese dürfen nur Kleinbuchstaben sein, keine Sonderzeichen, keine Großbuchstaben! @BODY VORN = @BODY VORN = Präsentation der Ergebnisse Alta Vista bietet 3 Formate für Trefferlisten an: Standard: (def.): insgesamt "Word count" für die Suchbegriffe, "Title" (als Hyperlink) plus die ersten 3 Zeilen des Dokuments, "URL" (auch als Hyperlink) und Größe und Datum des Dokuments. "Detailed" entspricht dem Standard-Format. "Compact" liefert Title (Hyperlink), Datum und die erste Zeile des Dokuments. Die Trefferlisten sind nach Wertigkeit sortiert: Diese steigt mit der Anzahl der Treffer bei mehreren Suchtermen und der Position des Treffers am Anfang des Dokuments, außerdem erhöht sich die Wertigkeit, wenn der Suchterm mehr als einmal vorkommt (dann aber ist es egal, wie oft). Relevant ist ferner, ob die Suchterme seltene Begriffe sind, sowie die relative Nähe der Suchbegriffe zueinander. @BODY VORN = Sonstiges In der Trefferliste wird angegeben, ob und wieviele Dubletten ausgefiltert werden, es sind jedoch trotzdem teilweise Dubletten zu finden. Die Anwortzeiten sind sehr unterschiedlich, zum Teil sehr langsam, manchmal sehr schnell. Es scheint, daß insbesondere die Datenübertragung den Flaschenhals darstellt. Eine Suche in FTP-Servern ist möglich sowie eine Suche im Usenet. Eine Liste der indexierten Gruppen konnte ich jedoch nicht ausfindig machen. Bei der Suche im Usenet kann man die Suche auf die Mailfelder FROM, <%-4>SUBJECT, NEWSGROUPS, SUMMARY, KEYWORDS<%0> beschränken. Die News können abgerufen werden, indem man in der Ergebnisliste "L" anklickt, allerdings nur, wenn Sie auf dem lokalen Server liegen. @BODY VORN = Bewertung Alta Vista bietet mit Abstand die besten Möglichkeiten, eine Suche genau zu spezifizieren: Boolsche Operatoren, Feldbegrenzungen, Trunkierung, Einschränkung auf Zeiträume. Die Trefferlisten sind übersichtlich, der Umfang der Datenbank ist ebenfalls sehr groß. Leider lassen die Antwortzeiten häufig stark zu wünschen übrig und die Anwendung der Suchmöglichkeiten erfordert eine gewisse Eingewöhnungszeit. Dadurch ist Alta Vista für den Gelegenheitsbenutzer in seinem vollen Funktionsumfang nur bedingt geeignet. @UEBER LINIEN = WebCrawler (http://webcrawler.com) @BODY VORN = Allgemeines WebCrawler wurde entwickelt von Brian Pinkerton an der University of Washington, im Dept. of Computer Science and Engineering. Das System wird seit April 1994 angeboten und wurde im Juni letzten Jahres von dem Internet Provider "America Online" aufgekauft. @BODY VORN = Umfang, Ausgewertete Quellen Die Datenbank enthält nach eigenen Angaben 420.000 indexierte Dokumente in einem Index in der Größe von 270 MB. Die Software läuft auf einem PC-Cluster unter Nextstep und soll pro Tag ca. 2,7 Mio. Queries bearbeiten können. In der Datenbank sind HTML-Seiten, Gopher- und FTP-Server indexiert. Die Auswertung umfaßt den Volltext der HTML-Seiten, Titel sowie Links. @BODY VORN = Suchmöglichkeiten Es wird nur eine Suchmaske angeboten, mit einem <%2>Eingabefeld für Suchbegriffe. Es kann zwischen Boolscher<%0> AND- und OR-Verknüpfung gewählt werden, "default" ist im Gegensatz zu Lycos und Alta Vista die AND-Verknüpfung. Eine Begrenzung auf bestimmte Suchfelder wird nicht angeboten. Die Anzahl der Results kann auf max. 100 eingestellt werden, "default" ist 25. Es wird nicht automatisch rechtstrunkiert. @BODY VORN = Sonderzeichen, Stoppworte Die Hilfe sagt weder über Trunkierung noch über die Behandlung von Sonderzeichen etwas aus. "*" als Trunkierungszeichen funktioniert nicht. Deutsche Umlaute können offenbar nicht gesucht werden. Es gibt Stoppworte, z.B. "the" und "of". Im Gegensatz zu den anderen beiden Suchmaschinen wird auf Stoppworte bei der Präsentation der Suchergebnisse nicht hingewiesen. @BODY VORN = Präsentation der Suchergebnisse Im Vergleich zu Lycos und Alta Vista sind die Trefferlisten sehr viel schlichter gehalten. Sie enthalten die Anzahl gefundener Dokumente, die Angabe der Wertigkeit und die HTML-Titel zum Anklicken und sind wie bei Lycos immer mit Werbung garniert. @BODY VORN = Sonstiges Die Hilfe ist gut gemacht, aber viel zu oberflächlich und nur für Laien eine Hilfe. Zur Geschwindigkeit ist zu sagen, daß der WebCrawler - anders als der Name vermuten läßt - sehr schnell arbeitet. Zusätzlich zur Suchmaske gibt es einen Hyperlink auf Random Links: es werden 10 beliebige URLs aus der Datenbank des WebCrawlers gezeigt. Interessanter als diese sind die TOP 25 Sites: die Liste der URLs, auf die andere Dokument am häufigsten linken. Eine Registrierung von URLs ist möglich, ebenso die Suche in FTP-Servern. @BODY VORN = Bewertung WebCrawler ist ein konsequent einfach gehaltenes System. Es ist zwar karg, aber schnell. WebCrawler ist sehr übersichtlich und vor allem für den Laien recht brauchbar - nicht umsonst hat gerade America Online das System gekauft. Die Datenbank ist wesentlich kleiner als bei Lycos und Alta Vista, entsprechend geringer auch die Vollständigkeit. Für eine professionelle Suche ist das System zu wenig kalibrierbar. Lycos und Altavista ist daher der Vorzug zu geben. @BODY VORN = Dr. Michael W. Mönnich, Universitätsbibliothek Karlsruhe,<%-2> Tel. 608-2298, Email: moennich@ubka.uni-karlsruhe.de.<%0> @AUTOR FUNKTIN = Dr. M. Mönnich Universitätsbibliothek Karlsruhe @UEBER = Netscape 2.0 mit Sicherheitslücken <%-2>Netscapes neue Internet-Software, der Navigator 2.0, hat eine häßliche Sicherheitslücke:<%0> Die neu entwickelte Programmiersprache Java, die im Internet eine Vielzahl neuer Anwendungen ermöglicht, erlaubt auch Fremdzugriffe auf PCs und Netzwerke. Einer Forschungsgruppe der Universität Princeton gelang es, Java-Programme zu schreiben, die in Desktop-PCs und Netzwerke eindrangen. Die Programmiersprache Java ist ein Produkt von Sun-Microsystems und gilt als Geniestreich im Internet. Java-Programme sind klein, netzwerkorientiert und stehen im Internet bedarfsweise zur Verfügung. User ersparen sich das zeitraubende Downloaden jeweils benötigter Programme. In Java geschriebene Anwendungen laden sich das Programm gleich mit dazu. Eine zweite von Netscape entwickelte Programmiersprache heißt JavaScript und ähnelt Java, wird jedoch im Browser selbst interpretiert und nicht wie Java als compilierter Code übertragen und ausgeführt. Was so interaktiv und netzwerkorientiert funktioniert, birgt eben auch Risiken. Der aktuelle Netscape Navigator in der Version 2.0 beinhaltet sowohl eine Java- als auch eine JavaScript-Programmierumgebung. In beiden Umgebungen treten Sicherheitsmängel auf: In der plattformunabhängigen Programmiersprache Java werden Programme, sogenannte Applets, geschrieben, die innerhalb eines WWW-Browsers ausgeführt werden. Dabei sollte der Java Applet Security Manager die Sicherheit gewährleisten. Durch Implementierungsmängel ist es bei der 2.0-Version allerdings möglich, daß Applets eine Verbindung zum Datenaustausch zu beliebigen Rechnern herstellen und auf diese Weise jeglichen Firewall in seiner Funktion umgehen können. Netscape bietet in der 2.01-Version, die bereits auf allen RZ-betreuten Rechnern installiert ist, einen Schutz vor solchen beliebigen Verbindungen. Dabei darf ein Java-Programm nur noch mit dem aktuellen WWW-Server eine Verbindung zwecks Datenaustausch aufbauen. Aktuelle Informationen zu dieser <%-3>Problematik sind unter der URL http://www.netscape. <%0>com/newsref/std/java_security.html verfügbar. Ein anderes Problem bezieht sich auf die Programmiersprache JavaScript, die in HTML-Dokumenten enthalten im Netscape Browser interpretiert wird. Im Netz sind derzeit sogenannte Exploit-Scripts verfügbar, die z.B. die Email-Adresse eines WWW-Benutzers ausspähen, den Inhalt der lokalen Cache-und History-Seiten inspizieren und Verzeichnisstrukturen der lokalen Maschine erstellen können. Netscape Navigator bietet in der 2.0-Version keine Möglichkeit, die Ausführung von JavaScripten zu unterbinden. In der Update-Version 2.01 existiert im Options-Menü im Unterpunkt "Security Preferences" die Möglichkeit, die Ausführung von Java- und JavaScript-Programmen zu unterbinden. Wer sich derzeit nicht auf ein Abenteuer in Sachen Sicherheit einlassen möchte, dem empfiehlt das Rechenzentrum bei der erstmaligen Benutzung der neuen Version, die Optionen manuell zu deaktivieren ("disable Java", "disable JavaScript" und danach "save options")! Leider lassen sich diese Optionen nicht standardmäßig deaktivieren, so daß dies jeder Benutzer eigenständig machen muß. @BODY VORN = Ulrich Weiß, Tel. -4868, Email: Uli@rz.uni-karlsruhe. de. @AUTOR FUNKTIN = Ulrich Weiß @UEBER = IBM 3090-Abschaltung: Änderungen beim Plot- und Druckbetrieb Im Vorfeld der schon mehrfach angekündigten Abschaltung werden an der IBM 3090 Zug um Zug einzelne Dienste abgebaut sowie Lizenzen kommerzieller Softwarepakete nicht mehr erneuert. Durch das Erlöschen der IBM 3090-Lizenz für das in der Plot-Betriebssoftware intensiv genutzte Statistik- und Analyse-Paket 'SAS' ergeben sich ab April 96 einige Änderungen im Plot- und Druckbetrieb. Details zu diesen Änderungen und Informationen zum aktuellen Stand des Plotbetriebs oder zu kurzfristigen Änderungen finden Sie im WWW unter der URL @BODY VORN = http://www.uni-karlsruhe.de/~Harald.Meyer/ unter dem Stichwort 'Beratung' sowie in der Hardware-WWW-Seite des RZ (Stichwort 'Plotgeräte'). Wichtigste Änderungen: @BODY BLICK 1 = Der Benutzerzugang zur IBM 3090-Plotsoftware (GKS, PLOTUTIL) bzw. zum RGDD-TeX-Treiber endet auf der 3090 definitiv mit dem Auslaufen der ASM2-Lizenz im Juni 96. Schon vorher wird es zu Einschränkungen im Betrieb kommen (z.B. Verlängerung der Turn-Around-Zeiten zwischen dem Absenden des Druckauftrags an der 3090 und der Ausgabe) @BODY BLICK 1 = Der Versatec-Farbplotter wird im Mai 96 durch einen A0-Farbtintenstrahldrucker ersetzt. Der Tintenstrahldrucker wird als Eingabeformat PostScript und HPGL verstehen, wodurch sich der Zugriff auf den Plotter für die meisten Leute wesentlich vereinfachen wird. Vorsicht: Die Materialkosten werden beim Tintenstrahldrucker höher als beim Versatec liegen (in der Größenordnung 10 DM pro A0-Poster, das Ganze hängt vom Farbverbrauch ab). @BODY BLICK 1 = An den Workstations wird die Xerox 4050-Textausgabe generell auf PostScript umgestellt. Dadurch wird sich das Schriftbild und das Seitenformat bei ASCII-Textausgabe etwas verändern. @BODY BLICK 1 = Der Aristo-Tischplotter wird in die UNIX-Welt übernommen. Während der Umstellungsphase kann es zu kurzfristigen Betriebsunterbrechungen und zu Verzögerungen bei der Plotausgabe kommen. @BODY VORN = Harald Meyer, Tel. -4036, Email: Harald.Meyer@rz. uni-karlsruhe.de. @AUTOR FUNKTIN = Harald Meyer @UEBER = Anwendungssoftware @UEBER LINIEN = <%-2>ADINA 6.2 - jetzt mit grafischer Oberfläche<%0> Auch ADINA R&D paßt sich den Bedürfnissen seiner Nutzer an und stellt ab der Version 6.2 eine grafische Oberfläche zur Verfügung, unter der Pre- und Postprocessing durchgeführt werden kann und auch die Analysejobs angestoßen werden können. Das neue System heißt ADINA/AUI (<%-2>für ADINA User Interface)<%0>. Ein Wermutstropfen bleibt jedoch, es steht (noch) nicht der volle Funktionsumfang des ADINA- Systems zur Verfügung. Im Einzelnen fehlen: @BODY BLICK 1 = das komplette ADINA-T @BODY BLICK 1 = die Schnittstellen zu PATRAN und I-DEAS @BODY BLICK 1 = einige Elemente und Funktionen von ADINA @BODY BLICK 2 = PIPE-, FLUID-, Multilayer-, Übergangs- und General Elemente @BODY BLICK 2 = mehrere Lastfälle, elektromagnetische Lastfälle @BODY BLICK 2 = Substrukturen, zyklische Symmetrie @BODY BLICK 2 = Bruchmechanik, Versagenskriterien @BODY BLICK 2 = Response Spektrumsanalyse und Schwingungsanalyse Trotz dieser Einschränkungen kann es sich dennoch lohnen, mit ADINA/AUI zu arbeiten, da die Arbeit mit den ADINA-IN und ADINA-PLOT Handbüchern entfällt und die Einarbeitung in ADINA erheblich vereinfacht wird. ADINA/AUI steht an den HP-Workstations im RZ-Pool (rz70 und rz71) zur Verfügung. Gegen eine Bearbeitungsgebühr kann eine Lizenz auch für Institutsmaschinen erworben werden. Das bisherige ADINA 6.1.4 kann wie bisher benutzt werden. Eine neue Kurzdokumentation findet man unter http://www.uni-karlsruhe.de/~ADINA/. @BODY VORN = Dr. Paul Weber, Tel. -4035, Email: Paul.Weber@rz.uni-karlsruhe.de. @AUTOR FUNKTIN = Dr. Paul Weber @UEBER LINIEN = Campuslizenz für ISDNpm unter OS/2 ISDNpm ist ein OS/2-Programm für die Nutzung von TCP/IP-Verbindungen über ISDN. Man kann also seinen heimischen OS/2-Rechner transparent mit dem Campusnetz verbinden und alle Internet-Dienste nutzen, wie man das von der Uni her gewöhnt ist. Dabei erfolgt sogar der Verbindungsauf- und Abbau auf Wunsch automatisch. Das Programm setzt auf die CAPI.DLL auf, und ist daher mit alle gängigen ISDN-Karten einsetzbar. Laut Hersteller wurde es mit Karten von Teles, Diehl, NCP, AVM-B1, ELSA und BINTEC getestet. IP-seitig arbeitet es problemlos mit IBM TCP/IP Version 2.0, 3.0 und dem Internet Access Kit (IAK) aus dem Bonus Pack zusammen. Die beschaffte Version ist eine Campuslizenz für die Uni Karlsruhe, mit der Einschränkung, daß ausschließlich der ISDN-Zugang des Rechenzentrums angewählt werden kann (Rufnummer: 0721-93179). Die Konfigurationsdateien sind weitgehend den Gegebenheiten des RZ-Zugangs der Uni Karlsruhe angepaßt. Es muß lediglich die eigene lokale IP-Adresse angegeben werden. Das Programm liegt auf dem FTP-Server des RZs <%-2>unter ftp.rz.uni-karlsruhe.de/pub/local/isdn/ <%0>isdnpm Infos zum ISDN-Eingang des Rechenzentrums finden Sie im WWW unter http://www.uni-karlsruhe.de/~ISDN/ @AUTOR FUNKTIN = Christoph Zimmermann @UEBER = Veranstaltungen @UEBER LINIEN = AVS - KURS Frau Dr. Schroeck-Pauli vom RZ der Universität Ulm, die auch Landesbeauftragte für die AVS/UNIRAS-Landeslizenz ist, wird einen dreitägigen Einführungskurs in das interaktive graphische Visualisierungsprogramm AVS durchführen: @BODY TABS = Datum: Montag, den 6.5.96 bis Mittwoch, den 8.5.96 @BODY TABS = Zeit: jeweils 10.15 - 12.30 Uhr Einführung und 14.15 - 16.45 Uhr Übungen zu AVS @BODY TABS = Ort: RZ, Raum -101 UG @BODY TABS = Anmeldung: <%-2>Eintrag in die AVS-Liste in der Betriebs-a<%-3>uskunf<%-2>t, Raum -156 oder Email an: katerbau@rz.uni- <%0>karlsruhe.de AVS ist in den Pools installiert und kann gegen eine jährliche Pauschale von DM 500.- auch auf Workstations in den Instituten installiert werden. <%-2>Da die Teilnehmerzahl begrenzt ist, wird eine schnelle Anmeldung empfohlen.<%0> @AUTOR FUNKTIN = Joachim Katerbau @AUTOR FUNKTIN = @AUTOR FUNKTIN = @UEBER = Kurz berichtet @UEBER LINIEN = Neu: Hotline im RZ Bei technischen Fragen, bei denen Sie den entsprechenden Ansprechpartner nicht kennen, können Sie sich an unsere Hotline wenden. Sie ist täglich von 10.00 bis 16.00 Uhr besetzt, meistens auch etwas länger. Die Hotline erreichen Sie @BODY TABS = live: im Raum -102 im Rechenzentrum @BODY TABS = per Telefon: 608-2997 @BODY TABS = per Email: hotline@rz.uni-karlsruhe.de @BODY TABS = @BODY TABS = @BODY TABS = @AUTOR FUNKTIN = Christoph Zimmermann