PROFI Search Appliance - PROFI Engineering Systems AG
PROFI Search Appliance - PROFI Engineering Systems AG
PROFI Search Appliance - PROFI Engineering Systems AG
Verwandeln Sie Ihre PDFs in ePaper und steigern Sie Ihre Umsätze!
Nutzen Sie SEO-optimierte ePaper, starke Backlinks und multimediale Inhalte, um Ihre Produkte professionell zu präsentieren und Ihre Reichweite signifikant zu maximieren.
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong><br />
Ihr Einstieg in die hausinterne Suchmaschine<br />
Dr. Michael Kosmowski<br />
Senior Software Berater<br />
Tel.: 0721 46 46 46 – 64 44<br />
E-Mail: m.kosmowski@profi-ag.de
<strong>AG</strong>ENDA<br />
01<br />
02<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ansatz und Ziele<br />
Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />
03 Technik & Konzepte<br />
04 Einsatzmöglichkeiten, Beispiele<br />
05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />
2<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Enterprise Content Management = ECM<br />
Enterprise Content<br />
Management<br />
� Strukturierte Daten<br />
� Daten sind in bestimmter Art<br />
und Weise angeordnet<br />
� „Klassisch“: in Datenbanken<br />
� Unstrukturierte Daten<br />
� Vorliegen digitalisierter Informationen<br />
in einer nicht formalisierten Struktur<br />
� Kein Datenmodell<br />
„Texte“ i.w.S. in „Dokumenten“,<br />
E-Mails, Web-Content, Social Media, etc.<br />
� Produktbegleitende Dokumentationen<br />
� Dokumente von Forschung & Entwicklung, Qualitätsmanagement, Marketing & Vertrieb …<br />
� Berichte über Produkte, Beobachtung des Mitbewerbs, …<br />
� Dokumentieren der Kundenkommunikation<br />
� Support und Service (Besuchsberichte, Fehlermeldungen, Serviceberichte, …)<br />
� Kundenfeedback (Reklamationen, Beschwerdemanagement, Meinungsbild in Sozialen Netzen …)<br />
� … und viele andere mehr …<br />
3<br />
18.09.2012<br />
Erfassen<br />
Aktivieren Gemeinsam<br />
Nutzen<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
Analysieren<br />
Quelle: IBM<br />
Verwalten<br />
Innerhalb &<br />
außerhalb des<br />
Unternehmens
Strukturierte und Unstrukturierte Informationen<br />
80% des Wissens liegt in den unstrukturierten Informationen<br />
Explosionsartiger Anstieg der Datenmenge<br />
800.000<br />
petabytes<br />
35<br />
zettabytes<br />
Dieses Wissen muss gehoben werden!<br />
4<br />
18.09.2012<br />
Datenerstellung<br />
und Abruf<br />
OLTP und BI<br />
(begrenzter Bereich)<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
Wert/ Nutzen von in<br />
traditionellen Datenbanken<br />
verwalteten Informationen<br />
Anwendungs-<br />
Typen<br />
Quelle: IBM<br />
(zitiert: Gartner & IDC)<br />
Content<br />
Unstruk-<br />
turierte<br />
Daten<br />
Strukturierte<br />
Daten<br />
Compliance, Wettbewerbsbetrachtung<br />
(erweiterter Bereich)
Kennen Sie das?<br />
� Werden alle Datenquellen auch genutzt? Oder läßt man diese wegen eines „unbequemen<br />
Zugangs“ bei der Arbeit einfach außen vor?<br />
� Kann man die Qualität des Erstellens und Nutzens von Informationen dadurch verbessern, daß<br />
die Form der Ablage völlig nebensächlich ist? Werden wegen fehlender „guter Zugriffe“ Daten<br />
„einfach so, irgendwo“ abgelegt und sind damit für andere Mitarbeiter nicht nutzbar?<br />
� Suchen ist zeit- und ressourcenintensiv – kann man das optimieren? Rechnet sich das?<br />
� Mit welchen Mittel und Methoden kann man über heterogene Datenquellen suchen? Geht das<br />
auch zugleich für interne und externe Dokumente?<br />
� Kann man Dokumentinhalte „automatisch verstehen“, kann man sie automatisch strukturieren?<br />
� Kann man die Suche erweitern um eine automatische Einordnung der Dokumentinhalte in<br />
„meine eigene“ Begriffswelt?<br />
� Kann man Probleme in der Produktqualität, der Kundenzufriedenheit, Sicherheitslücken etc.<br />
oder neue Geschäftschancen aus den eigenen oder den externen unstrukturierten Daten<br />
erkennen?<br />
� Kann man Fachabteilungen ein Analysewerkzeug an die Hand geben, mit dem diese selbst auf<br />
Entdeckungsreise gehen können um bisher unbekannte Zusammenhänge und Trends zu<br />
entdecken?<br />
� Kann man„gefühlte Zusammenhänge“ aus den unstrukturierten Daten mit „Zahlen und Bildern“<br />
belegen?<br />
� …<br />
5<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Ausgangssituation<br />
„Suche“ als Integrationsplattform und Wissensservice verstehen<br />
� Alle relevanten Datenquellen von einem Frontend aus durchsuchen<br />
� Trefferanzeige � Klick darauf � Information an der Quelle<br />
� Nebeneffekte<br />
� mögliche weitere relevante Informationen zum Suchbegriff<br />
� Unbekannte, Verschollen geglaubte od. „falsch abgelegte“ Informationen tauchen wieder auf<br />
Unser Credo: Finden von Informationen - Mehr als Suchen<br />
� Einfache Bedienung für den Anwender<br />
� Aufwerten der Suche durch „Anreicherung“ (Annotatoren)<br />
� Leichtes Eingrenzen der Suche<br />
� Ein-/ausblenden der Datentöpfe – Unterstützen benutzergruppenspezifische Suche<br />
� Facetten-Suche (gebildet aus Metadaten und Annotatoren)<br />
� Eingrenzen nach Zeit, Dokumenttyp, ...<br />
� Eingebettete sinnvolle Tools<br />
� Boosten von Ergebnissen, eigene Sortierung der Trefferliste (nach Datum, Treffergenauigkeitsbewertung, …)<br />
� „Meinten Sie …“ – Rechtschreibfehlererkennung<br />
� Quicklinks – Verweis auf einen antizipierten Treffer bei einem bestimmten Suchbegriff<br />
� Export der Treffer als (z.B.) csv-Datei<br />
� Speichern wiederkehrender (und ggf. komplexer) Abfragen, erneuter Aufruf per Klick<br />
� Timeline, Preview, Doublettenerkennung …<br />
6<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Kerngedanken „Eigene Suchmaschine“<br />
Einbinden der relevanten Datentöpfe<br />
� Unterstützung für die verbreiteten Datenquellen (ca. 30 Quellentypen mit ca. 200 Formaten)<br />
� Standards …<br />
� … und dennoch Flexibilität durch offene und dokumentierte Schnittstellen (API)<br />
Datensicherheit<br />
� Im Suchindex besteht Zugriff auf alle (ggf. recht sensiblen) Daten<br />
� Die eigenen Daten sind und bleiben im eigenen Haus (inkl. Wartung)<br />
� Sichere Suche: ein Benutzer sieht nur die Treffer in einer Suchanfrage, auf die er auch<br />
Zugriff hat<br />
� Möglichkeiten des robusten Datenschutzes<br />
• Auf „genereller Ebene“<br />
• Auf „Dokumentebene“<br />
� Anbindung verschiedener Authentifizierungssysteme<br />
Einbindung in die eigene IT-Architektur<br />
� Betriebssystem und Plattform der eigenen Wahl<br />
� Skalierbarkeit und Transparenz der Systeme<br />
� planbares Lizenzmodell<br />
7<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Projektpartner <strong>PROFI</strong> <strong>Engineering</strong> <strong>Systems</strong> <strong>AG</strong><br />
Innovativer IT-Partner für Lösungen im deutschen<br />
Mittelstand, in Großunternehmen und für<br />
Öffentliche Verwaltungen<br />
� Gegründet 1984, Inhabergeführt<br />
� Umsatz Geschäftsjahr 2011/12: 134 Mio €<br />
� 14 Standorte bundesweit, Zentrale: Darmstadt<br />
� ca. 330 Mitarbeiter<br />
� 173 SE‘s & Consultants<br />
� 117 Vertriebsmitarbeiter, 25 <strong>PROFI</strong>-Office, 15 Auszubildende<br />
� Lösungen<br />
� IT-System-Infrastruktur<br />
• Cloud Computing, Virtualisierung, System Management, Hochverfügbarkeit, Backup &<br />
Recovery, Security, Netzwerke, Speichersysteme, …<br />
� IT-Software-Lösungen<br />
• Archivierung, Contentmanagement, Content Analytics, Collaboration, Messaging,<br />
Portale, Identity & Access, Lizenzmanagement, Software-Audits<br />
Service, Software und Hardware aus einer Hand<br />
8<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
Bochum<br />
Köln<br />
Bremen<br />
Hamburg<br />
Darmstadt<br />
Mannheim<br />
Karlsruhe<br />
Stuttgart<br />
Villingen-<br />
Schwenningen<br />
München<br />
Berlin<br />
Chemnitz<br />
Weiden<br />
Nürnberg
Wie komme <strong>PROFI</strong> zu dem Thema<br />
„Finden von Informationen: Mehr als Suchen!“<br />
Aus unserer Projektarbeit<br />
� Archivierungslösungen<br />
� In unterschiedlichen Kontexten (SAP, Mail [Lotus Notes/Domino, MS-Exchange], File-Systeme, …)<br />
� Insbesondere getrieben vom Gedanken: Compliance<br />
� Workflow-Lösungen (unter Beteiligung elektronischer Dokumente)<br />
� Fluß von Dokumenten in Anwendungen (Prozesse)<br />
� Lotus Domino Workflow<br />
� Frühes und spätes Scannen von Dokumenten<br />
Immer wieder die gleiche Frage: Wie finde ich Informationen?<br />
� Metadaten als erster Zugang<br />
� Aber …<br />
� Über Datentöpfe hinweg im gleichen Frontend<br />
� Sicherheit<br />
• robuste Architektur<br />
• Datensicherheit<br />
� Skalierbarkeit (offene, etablierte und dynamische Architektur, die auf Standards beruht)<br />
9<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
<strong>AG</strong>ENDA<br />
01<br />
02<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Beteiligte und Ziele<br />
Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />
03 Technik & Konzepte<br />
04 Einsatzmöglichkeiten, Beispiele<br />
05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />
10<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Kernfrage: Wie finde ich die richtigen Informationen?<br />
Was heißt „richtige Informationen“ finden?<br />
� Wiederfinden einer bestimmten Word-Datei?<br />
� Es geht um die Information in dieser Datei<br />
Die richtige Information ist mehr:<br />
Wer, wie, was, wo, wann, wieviel, warum?<br />
Die Herausforderung für „richtige Informationen“<br />
� Erkennen<br />
� Strukturierte Daten (z.B. Datenbanken etc.): enthalten meist Wer, Wo, Was, Wieviel, Wann (� BI)<br />
� Unstrukturierte Daten (z.B. Word-Dateien, Blogs und Forum-Einträge etc.): Wie & Warum<br />
enthalten ggf. aber auch (und zwar nur hier) das Wer, Wo, Was, Wann und Wieviel<br />
� Automatisiert extrahieren<br />
� Recherchierbar machen<br />
� Analysieren können<br />
� Content Analytics<br />
11<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
Unstrukturierte Daten<br />
so nutzen als wären<br />
sie strukturiert
Wie weit geht Analytics (schon heute)?<br />
Am 16.02.2011 gewann die Quizshow Jeopardy<br />
Breites Wissen aus Politik, Geschichte, Literatur, Kunst,<br />
Unterhaltung, Wissenschaft erforderlich<br />
� Keine einfachen Fragen: Ironie, mehrdeutige Fragen,<br />
subtile Bedeutungsunterschiede, Wortspiele, Rätsel<br />
� Beispiel Kategorie Sprichwörter:<br />
Sogar eine kaputte von diesen<br />
stimmt 2 x am Tag …<br />
Was ist eine Uhr<br />
Spiel-Idee Jeopardy: Verständnis der Frage & das Finden der richtigen<br />
Antwort in möglichst kurzer Zeit<br />
Watson zeigt: eine hochwertige semantische<br />
Suchmaschine ist heute realisierbar<br />
� Sinn komplexer Fragen erfassen<br />
� Auffinden relevanter Informationen<br />
� Bewerten der Informationen<br />
� Mit „abgeschlossenem Wissen“<br />
� Unter Zeitnot<br />
12<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
Ohne Analyse<br />
von Texten kann<br />
ich wenig mit<br />
meinem Wissen<br />
anfangen.<br />
http://www.ibm.com/innovation/us/watson/index.html
Enterprise <strong>Search</strong> und Content Analytics<br />
Auffinden von Informationen<br />
Analysieren von Informationen<br />
� Ansatz „Enterprise <strong>Search</strong>“ � Ansatz Content Analytics<br />
Anreichern von Informationen<br />
Unterschiedliche Ausprägungen des gleichen Themas<br />
Das Gewicht zwischen Suchen und Analytics wird je nach Situation<br />
unterschiedlich sein<br />
� Gut zu wissen: das gesamte<br />
Spektrum wird abgedeckt<br />
� Watson beweist: … wird<br />
erfolgreich abgedeckt<br />
„Einfache Suche“<br />
13<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
„Konzept Suche“
Der Nutzen von Enterprise <strong>Search</strong> und Content Analytics<br />
Informationen aus den 80% (unstrukturierte Daten) nutzen<br />
� Schnelleres Finden von Informationen<br />
� Zusammenhänge aufdecken<br />
� Unbekanntes oder Verborgenes entdecken<br />
� Bessere Entscheidungen treffen: Beweisbar durch Charts, Reports, Direktzugriff bei Management Summary<br />
(Dashboards)<br />
Kosten sparen<br />
� Einfache Suche: ROI-Berechnung<br />
� Analytics: Fehlinvestitionen vermeiden, Folgekosten reduzieren<br />
Kerngeschäft verbessern – Position im Markt verbessern – Profitabler werden<br />
� Zielgenaue Integration in Geschäftsprozesse<br />
� Servicequalität und Kundenansprache erhöhen<br />
� Innovativ sein<br />
� Neue Geschäftschancen entwickeln<br />
14<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
<strong>AG</strong>ENDA<br />
01<br />
02<br />
03<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Beteiligte und Ziele<br />
Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />
Technik & Konzepte<br />
04 Einsatzmöglichkeiten, Beispiele<br />
05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />
15<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Wie arbeitet Content Analytics & Enterprise <strong>Search</strong>?<br />
1. Crawler besuchen die<br />
Datenquellen<br />
Crawler<br />
3. Informationen<br />
werden geparst<br />
und indexiert<br />
UIMAbasierteIntelligenzbausteine<br />
16<br />
18.09.2012<br />
Index<br />
2. Metadaten,<br />
ACL & Content<br />
werden<br />
gecrawlt<br />
Netzwerk<br />
5. Im Index:<br />
Suche nach<br />
Treffern<br />
Textminer-<br />
oder<br />
Such-<br />
6. Ergebnisliste<br />
zurück<br />
anwendung 4. Benutzer<br />
“fragt”<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
Content (intern, ggf. extern)<br />
Webseiten, Filesysteme,<br />
DBen, CMS, DMS, …<br />
7. Benutzer fordert<br />
die Info von der<br />
Quelle
Wo kommt die Intelligenz her? Analytics-Komponenten<br />
Optional: Crawler-Plugin<br />
� „Special-“ Crawlen von „besonderen Daten“<br />
� Anreichern der gecrawlten Daten<br />
Wörter und Phrasen<br />
� Spracherkennung (als Voraussetzung für das Folgende)<br />
� Sequentierung, Lemmatisierung, Normalisierung der Wörter<br />
� Erkennen von „Grammatik“ (Substantiv, Verb, etc.)<br />
Zeichenregeln – Character Rules<br />
Wörterbücher - Dictionaries<br />
� Z.B. Unternehmenswissen in Begriffe gefasst<br />
� Synonymwörterbücher<br />
� Abstraktionen (Wörter � Begriff)<br />
Beziehungen – Parsing Rules<br />
� Erkennen von Mustern und Zusammenhängen<br />
Klassifizierung<br />
Zusätzliche Java-Anwendungen<br />
17<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
Entwickelt mit<br />
Eclipse-Client,<br />
offene API<br />
Out of the Box<br />
(eingeschaltet)<br />
Erstellt mit<br />
Content<br />
Analytics<br />
Studio<br />
(bzw.<br />
Erstellung<br />
unterstützt)<br />
UIMA-konform<br />
Erstellt mit<br />
zusätzl. Mitteln
Modellierungswerkzeug für linguistische Komponenten<br />
Beispiel für Textanalyse<br />
Spracherkennung ► Segmentierung ► Normalisierung ► Anreicherung ► Wörterbücher ► Regeln<br />
Deutsch Einzelne Wörter:<br />
z.B. Ford<br />
Sätze:<br />
z.B. Nun ist aber<br />
die Klimaanlage<br />
kaputt.<br />
Grundform<br />
erkennen<br />
z.B.: gekauft<br />
� kaufen<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
Grammatik<br />
z.B. Reparatur<br />
� Nomen<br />
z.B. Kaufen<br />
� Verb<br />
z.B.<br />
z.B.<br />
a) Fachwörter Ein „Defekt“ ist,<br />
• Klimaanlage wenn „Fachwort“<br />
• Topf<br />
und „Defekt-<br />
Indikator“ in einem<br />
• …<br />
Satz auftreten.<br />
b) Defekt-Indikator<br />
• kaputt<br />
• defekt<br />
• …<br />
z.B.<br />
…Topf ... defekt …<br />
Hallo, ich habe vor 5 Monaten eine gebrauchten Ford Focus beim Händler gekauft.<br />
Nun ist aber die Klimaanlage kaputt.<br />
Ich habe den Wagen erst zum nächsten Fordhändler gebracht.<br />
Er hat dann bemerkt, dass der Topf, der das Kondenswasser auffängt, defekt ist.<br />
Summar summarum würde es sich auf 313 Euro belaufen. Nun ist meine Frage: Wäre<br />
diese Reparatur auch in der Gebrauchtwagengarantie enthalten, oder bräuchte ich<br />
es erst gar nicht versuchen?<br />
Quelle: IBM<br />
18<br />
18.09.2012
Inhalt und „angereicherter“ Inhalt � Zugang für Analytics<br />
Quell-Dokumente Crawl<br />
ACL<br />
Objekt-Metadaten<br />
•••<br />
ACL<br />
Objekt-Meta<br />
daten<br />
19<br />
18.09.2012<br />
typspezifisch<br />
definierter<br />
Crawler<br />
>30 Crawler für<br />
200 Datentypen<br />
Out Of Box<br />
Ggf. eigenes<br />
Crawler-PlugIn<br />
Holt ab:<br />
- Content<br />
(Binärtext)<br />
- Metadaten<br />
(- Security)<br />
Document Processing (P/I) „angereichertes“ Dokument<br />
Sequentielle Verarbeitung<br />
Wörter und Phrasen<br />
• Spracherkennung (als Voraussetzung<br />
für das Folgende)<br />
• Sequentierung, Lemmatisierung,<br />
Normalisierung der Wörter<br />
• Erkennen von „Grammatik“<br />
Wörterbücher<br />
Beziehungen – Rules<br />
Klassifizierung<br />
Regular Expressions<br />
Zusätzliche Java-Anwendungen<br />
(Security)<br />
Dokument-Content<br />
Analysierbare Felder (aus Metadaten)<br />
Mapping auf Facetten<br />
(Security)<br />
Dokument-Content<br />
aus Metadaten<br />
aus Grammatik<br />
aus Konzepten<br />
und Regeln etc.<br />
Analysierbare Felder aus Metadaten)<br />
Mapping auf Facetten<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchwort: Suchmaschine<br />
Chris<br />
Regular Expression: Phone Number<br />
aus Metadaten<br />
aus Grammatik<br />
aus Konzepten<br />
und Regeln etc.<br />
Im Index<br />
Thumbnail<br />
Index<br />
Taxonomy<br />
Index<br />
<strong>Search</strong><br />
Index<br />
Facet Count<br />
Sub Index
<strong>AG</strong>ENDA<br />
01<br />
02<br />
03<br />
04<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Beteiligte und Ziele<br />
Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />
Technik & Konzepte<br />
Einsatzmöglichkeiten, Beispiele<br />
05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />
20<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Datenquellenübergreifende Suche (1)<br />
Ziel: Volltextsuche datenquellenübergreifend, um Informationen<br />
aufzufinden<br />
� Inhalte aus unterschiedlichen Datenquellen (d.h. auch aus unterschiedlichen<br />
Datenquellen-Typen) werden über eine konsolidierte Oberfläche gefunden<br />
Typische Situationen für datenübergreifende einfache Suche sind z.B.<br />
� Erleichterung beim Auffinden von Informationen, deren Ablageort nicht exakt bekannt ist<br />
� mentale Entlastung<br />
� Fehlablagen korrigieren<br />
� Überwinden von Grenzen durch historisch entstandene bzw. technisch begründete<br />
Datencontainer<br />
� Finden von Informationen, deren Existenz dem Anwender gar nicht bekannt ist<br />
� Überblick über Informationen für neue Mitarbeiter schaffen<br />
21<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Datenquellenübergreifende Suche (2)<br />
Seit vielen Jahren sind in einer öffentlichen Verwaltung unterschiedliche Anwendungen<br />
im Einsatz zur Vorgangsbearbeitung- und Dokumentation:<br />
� Im Bauordnungsamt ist seit 1990 eine Fachanwendung BGV (Baugenehmigungsverfahren) im Einsatz,<br />
dort werden alle Datensätze und Dokumente gemäß der Anwendungslogik zwangsweise abgelegt.<br />
Eine elektronische Dokumentation aus der Zeit davor existiert nicht.<br />
� Für Dokumentationen (Gutachterausschuß, Kaufpreissammlung, Pressemeldungen, Stellungnamen zu<br />
Bürgeranfragen etc.) erfolgt die Ablage gemäß Aktenplan<br />
� Seit 2001 in einem elektronischen DMS<br />
� Davor (seit 1984) zunehmend in Ordnerstrukturen gemäß Aktenplan im Windows-Dateisystem<br />
� Aus der Zeit davor sind wichtige Dinge (mit eingetragenen Metadaten) eingescannt und – je nach Erstellung – im DMS<br />
oder im Filesystem abgelegt<br />
� Die Dokumentation der Baulasten erfolgt historisch<br />
� Bis 1985 ausschließlich in Papierform, dies ist alles eingescannt (mit Metadaten) und elektronisch in einem Dateisystem<br />
abgelegt<br />
� 1985-1997 ist alles elektronisch in Dokumenten geführt und im Dateisystem abgelegt<br />
� Ab 1.1.1998 sind die Baulasten im BGV (Fachanwendung s.o.) dokumentiert<br />
� Die Dokumentation der Bauleitplanung erfolgt so:<br />
� Verfahrensteil ist im BGV (Fachanwendung, s.o.) dokumentiert<br />
� Schriftlicher Teil ab Stichtag 1.1. 2004 im DMS, davor im Dateisystem abgelegt<br />
� Zeichnerischer Teil ab Stichtag 1.1. 2004 im GIS (Fachanwendung), davor im Dateisystem abgelegt<br />
Problem: Wie bekommt ein Mitarbeiter rasch die benötigten Informationen zusammen,<br />
wenn er sich in einem Verwaltungsvorgang mit den relevanten Informationen zu einem<br />
bestimmten Thema beschäftigen muß?<br />
22<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Such-<br />
begriff(e)<br />
Treffer-<br />
info<br />
Suche<br />
ein-<br />
grenzen<br />
Datenquellenübergreifende Suche (3): Suchbegriff „Illenau“<br />
Quellentyp<br />
Windows… = Dateisystem<br />
23<br />
JDBC-Dateisystem<br />
18.09.2012 <strong>PROFI</strong><br />
= BGV-BAT-Datei<br />
<strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
Notes = DMS<br />
Pictogramm<br />
Vorschau<br />
In Liste: klein<br />
Bei Klick: größer
Ein Live-Blick auf ICA 3.0<br />
„Sammlung von IT-Texten“ zu unterschiedlichen Themenbereichen<br />
� Im File-System abgelegt nach gewisser thematischer Zuordnung<br />
� Über Jahre hinweg gepflegt<br />
Suchen allein wäre schon hilfreich …<br />
Anreichern der Suche<br />
� Character-Rule<br />
� Hier: Erkennung Mail-Adresse<br />
� Dictionary – Wörterbücher<br />
� Spiegeln den Themenbezug wieder<br />
� Frei definiert und selbst erstellt<br />
� Konzepte � nicht ausgeführt<br />
Erweiterungsmöglichkeiten<br />
� Weitere Datentöpfe<br />
� andere Dokumentablagen im Filesystem<br />
� Archivsystem<br />
� DMS …<br />
� Secure <strong>Search</strong><br />
� Suche berücksichtigt die Benutzerrechte<br />
� Treffer wird nur angezeigt, wenn Leserecht an Quelle besteht<br />
24<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Ein Live-Blick auf ICA 3.0<br />
25<br />
18.09.2012 Annotatoren <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
Erkennen von Zusammenhängen aus unstrukturierten<br />
Daten. Intelligente Wissenserarbeitung (1)<br />
Anreichern von unstrukturierten Informationen durch eigene Wörterbücher und Regeln<br />
Nutzen dieser Strukturen für Analyse � hier: Korrelationen erkennen<br />
�<br />
26<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />
1. Eingestellt:<br />
Facette „Vendor“ � Blick auf Ford<br />
Dazu: Facette „Part Failed<br />
2. Eingestellt:<br />
Facette „Vendor“ � Blick auf Ford<br />
Facette „Part Failed“ � Engine<br />
Mounts Failed<br />
Dazu: Verben
Erkennen von Zusammenhängen aus unstrukturierten<br />
Daten. Intelligente Wissenserarbeitung (2)<br />
Visualisierung der Analysen<br />
� „Bauchgefühl“ zu Zahlen und<br />
Bildern werden lassen<br />
27<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
<strong>AG</strong>ENDA<br />
01<br />
02<br />
03<br />
04<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Beteiligte und Ziele<br />
Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />
Technik & Konzepte<br />
Einsatzmöglichkeiten, Beispiele<br />
05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />
28<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> PSA (1)<br />
Angebot der <strong>PROFI</strong> für ein definiertes Set (eine „typische Situation“):<br />
Es wird ein IBM Content Analytics-Paket zu einem Angebotspreis<br />
geschnürt.<br />
Das Paket besteht aus<br />
� der Hardware - als virtueller Rechner oder als physischer Rechner (mit VM),<br />
� den IBM-Lizenzen und<br />
� den <strong>PROFI</strong>-Dienstleistungen,<br />
um damit eine<br />
� realistische, profilierte Anforderung der Kunden im Umfeld Content Analytics & <strong>Search</strong><br />
� in definiertem Zeit-Aufwand und<br />
� mit definierten Kosten<br />
zu lösen.<br />
Das Ziel ist<br />
� den Interessenten/Kunden den Einstieg in ICA zu überschaubarem Aufwand anzubieten.<br />
� ein „konkretes“ und „greifbares“ Paket zur Verfügung zu haben<br />
� ein „Gefühl“ für Projekte, Inhalte und Anforderungen in diesem Bereich zu entwickeln<br />
29<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> PSA (2)<br />
Zusammenstellen der erforderlichen Informationen für die PSA beim Kunden<br />
Systemlieferung der PSA durch <strong>PROFI</strong> mit den Komponenten<br />
� Bereitstellen Rechner<br />
� Software Lizenzen für IBM Content Analytics With Enterprise <strong>Search</strong> Starter Pack<br />
� Herbeiführen der Betriebsbereitschaft der unternehmensweiten Suche als "All on One"-<br />
System mit<br />
� max. drei Standard-Datenquellen (wie z.B. Windows-Filesystem, Share-Point, IBM Connections, IBM Lotus Notes, E-<br />
Mailsystem Exchange/pst-Dateien)<br />
� im Gesamvolumen von max. 600 GB und<br />
� einem Verzeichnis (z.B. Active Directory oder LDAP Domino-Server).<br />
� Installationsbegleitende Schulung der Administratoren und Dokumentation<br />
Die Art der Einrichtung stellt sicher, dass nach Abschluss des Projektes<br />
� die Basis für die unternehmensinterne Suche & Anlayse gelegt ist, insbesondere die Suche<br />
in den o.g. Datenquellen für ca. 30 Benutzer zur Verfügung steht<br />
� sowie weiterführende Arbeiten an der unternehmensinternen Suche & Analyse auf diesem<br />
Stand aufbauen können.<br />
30<br />
18.09.2012<br />
<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine
VIELEN DANK!<br />
Dr. Michael Kosmowski<br />
Senior Software Berater<br />
Tel.: 0721 46 46 46 – 64 44<br />
E-Mail: m.kosmowski@profi-ag.de