18.11.2012 Aufrufe

PROFI Search Appliance - PROFI Engineering Systems AG

PROFI Search Appliance - PROFI Engineering Systems AG

PROFI Search Appliance - PROFI Engineering Systems AG

MEHR ANZEIGEN
WENIGER ANZEIGEN

Verwandeln Sie Ihre PDFs in ePaper und steigern Sie Ihre Umsätze!

Nutzen Sie SEO-optimierte ePaper, starke Backlinks und multimediale Inhalte, um Ihre Produkte professionell zu präsentieren und Ihre Reichweite signifikant zu maximieren.

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong><br />

Ihr Einstieg in die hausinterne Suchmaschine<br />

Dr. Michael Kosmowski<br />

Senior Software Berater<br />

Tel.: 0721 46 46 46 – 64 44<br />

E-Mail: m.kosmowski@profi-ag.de


<strong>AG</strong>ENDA<br />

01<br />

02<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ansatz und Ziele<br />

Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />

03 Technik & Konzepte<br />

04 Einsatzmöglichkeiten, Beispiele<br />

05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />

2<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Enterprise Content Management = ECM<br />

Enterprise Content<br />

Management<br />

� Strukturierte Daten<br />

� Daten sind in bestimmter Art<br />

und Weise angeordnet<br />

� „Klassisch“: in Datenbanken<br />

� Unstrukturierte Daten<br />

� Vorliegen digitalisierter Informationen<br />

in einer nicht formalisierten Struktur<br />

� Kein Datenmodell<br />

„Texte“ i.w.S. in „Dokumenten“,<br />

E-Mails, Web-Content, Social Media, etc.<br />

� Produktbegleitende Dokumentationen<br />

� Dokumente von Forschung & Entwicklung, Qualitätsmanagement, Marketing & Vertrieb …<br />

� Berichte über Produkte, Beobachtung des Mitbewerbs, …<br />

� Dokumentieren der Kundenkommunikation<br />

� Support und Service (Besuchsberichte, Fehlermeldungen, Serviceberichte, …)<br />

� Kundenfeedback (Reklamationen, Beschwerdemanagement, Meinungsbild in Sozialen Netzen …)<br />

� … und viele andere mehr …<br />

3<br />

18.09.2012<br />

Erfassen<br />

Aktivieren Gemeinsam<br />

Nutzen<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

Analysieren<br />

Quelle: IBM<br />

Verwalten<br />

Innerhalb &<br />

außerhalb des<br />

Unternehmens


Strukturierte und Unstrukturierte Informationen<br />

80% des Wissens liegt in den unstrukturierten Informationen<br />

Explosionsartiger Anstieg der Datenmenge<br />

800.000<br />

petabytes<br />

35<br />

zettabytes<br />

Dieses Wissen muss gehoben werden!<br />

4<br />

18.09.2012<br />

Datenerstellung<br />

und Abruf<br />

OLTP und BI<br />

(begrenzter Bereich)<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

Wert/ Nutzen von in<br />

traditionellen Datenbanken<br />

verwalteten Informationen<br />

Anwendungs-<br />

Typen<br />

Quelle: IBM<br />

(zitiert: Gartner & IDC)<br />

Content<br />

Unstruk-<br />

turierte<br />

Daten<br />

Strukturierte<br />

Daten<br />

Compliance, Wettbewerbsbetrachtung<br />

(erweiterter Bereich)


Kennen Sie das?<br />

� Werden alle Datenquellen auch genutzt? Oder läßt man diese wegen eines „unbequemen<br />

Zugangs“ bei der Arbeit einfach außen vor?<br />

� Kann man die Qualität des Erstellens und Nutzens von Informationen dadurch verbessern, daß<br />

die Form der Ablage völlig nebensächlich ist? Werden wegen fehlender „guter Zugriffe“ Daten<br />

„einfach so, irgendwo“ abgelegt und sind damit für andere Mitarbeiter nicht nutzbar?<br />

� Suchen ist zeit- und ressourcenintensiv – kann man das optimieren? Rechnet sich das?<br />

� Mit welchen Mittel und Methoden kann man über heterogene Datenquellen suchen? Geht das<br />

auch zugleich für interne und externe Dokumente?<br />

� Kann man Dokumentinhalte „automatisch verstehen“, kann man sie automatisch strukturieren?<br />

� Kann man die Suche erweitern um eine automatische Einordnung der Dokumentinhalte in<br />

„meine eigene“ Begriffswelt?<br />

� Kann man Probleme in der Produktqualität, der Kundenzufriedenheit, Sicherheitslücken etc.<br />

oder neue Geschäftschancen aus den eigenen oder den externen unstrukturierten Daten<br />

erkennen?<br />

� Kann man Fachabteilungen ein Analysewerkzeug an die Hand geben, mit dem diese selbst auf<br />

Entdeckungsreise gehen können um bisher unbekannte Zusammenhänge und Trends zu<br />

entdecken?<br />

� Kann man„gefühlte Zusammenhänge“ aus den unstrukturierten Daten mit „Zahlen und Bildern“<br />

belegen?<br />

� …<br />

5<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Ausgangssituation<br />

„Suche“ als Integrationsplattform und Wissensservice verstehen<br />

� Alle relevanten Datenquellen von einem Frontend aus durchsuchen<br />

� Trefferanzeige � Klick darauf � Information an der Quelle<br />

� Nebeneffekte<br />

� mögliche weitere relevante Informationen zum Suchbegriff<br />

� Unbekannte, Verschollen geglaubte od. „falsch abgelegte“ Informationen tauchen wieder auf<br />

Unser Credo: Finden von Informationen - Mehr als Suchen<br />

� Einfache Bedienung für den Anwender<br />

� Aufwerten der Suche durch „Anreicherung“ (Annotatoren)<br />

� Leichtes Eingrenzen der Suche<br />

� Ein-/ausblenden der Datentöpfe – Unterstützen benutzergruppenspezifische Suche<br />

� Facetten-Suche (gebildet aus Metadaten und Annotatoren)<br />

� Eingrenzen nach Zeit, Dokumenttyp, ...<br />

� Eingebettete sinnvolle Tools<br />

� Boosten von Ergebnissen, eigene Sortierung der Trefferliste (nach Datum, Treffergenauigkeitsbewertung, …)<br />

� „Meinten Sie …“ – Rechtschreibfehlererkennung<br />

� Quicklinks – Verweis auf einen antizipierten Treffer bei einem bestimmten Suchbegriff<br />

� Export der Treffer als (z.B.) csv-Datei<br />

� Speichern wiederkehrender (und ggf. komplexer) Abfragen, erneuter Aufruf per Klick<br />

� Timeline, Preview, Doublettenerkennung …<br />

6<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Kerngedanken „Eigene Suchmaschine“<br />

Einbinden der relevanten Datentöpfe<br />

� Unterstützung für die verbreiteten Datenquellen (ca. 30 Quellentypen mit ca. 200 Formaten)<br />

� Standards …<br />

� … und dennoch Flexibilität durch offene und dokumentierte Schnittstellen (API)<br />

Datensicherheit<br />

� Im Suchindex besteht Zugriff auf alle (ggf. recht sensiblen) Daten<br />

� Die eigenen Daten sind und bleiben im eigenen Haus (inkl. Wartung)<br />

� Sichere Suche: ein Benutzer sieht nur die Treffer in einer Suchanfrage, auf die er auch<br />

Zugriff hat<br />

� Möglichkeiten des robusten Datenschutzes<br />

• Auf „genereller Ebene“<br />

• Auf „Dokumentebene“<br />

� Anbindung verschiedener Authentifizierungssysteme<br />

Einbindung in die eigene IT-Architektur<br />

� Betriebssystem und Plattform der eigenen Wahl<br />

� Skalierbarkeit und Transparenz der Systeme<br />

� planbares Lizenzmodell<br />

7<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Projektpartner <strong>PROFI</strong> <strong>Engineering</strong> <strong>Systems</strong> <strong>AG</strong><br />

Innovativer IT-Partner für Lösungen im deutschen<br />

Mittelstand, in Großunternehmen und für<br />

Öffentliche Verwaltungen<br />

� Gegründet 1984, Inhabergeführt<br />

� Umsatz Geschäftsjahr 2011/12: 134 Mio €<br />

� 14 Standorte bundesweit, Zentrale: Darmstadt<br />

� ca. 330 Mitarbeiter<br />

� 173 SE‘s & Consultants<br />

� 117 Vertriebsmitarbeiter, 25 <strong>PROFI</strong>-Office, 15 Auszubildende<br />

� Lösungen<br />

� IT-System-Infrastruktur<br />

• Cloud Computing, Virtualisierung, System Management, Hochverfügbarkeit, Backup &<br />

Recovery, Security, Netzwerke, Speichersysteme, …<br />

� IT-Software-Lösungen<br />

• Archivierung, Contentmanagement, Content Analytics, Collaboration, Messaging,<br />

Portale, Identity & Access, Lizenzmanagement, Software-Audits<br />

Service, Software und Hardware aus einer Hand<br />

8<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

Bochum<br />

Köln<br />

Bremen<br />

Hamburg<br />

Darmstadt<br />

Mannheim<br />

Karlsruhe<br />

Stuttgart<br />

Villingen-<br />

Schwenningen<br />

München<br />

Berlin<br />

Chemnitz<br />

Weiden<br />

Nürnberg


Wie komme <strong>PROFI</strong> zu dem Thema<br />

„Finden von Informationen: Mehr als Suchen!“<br />

Aus unserer Projektarbeit<br />

� Archivierungslösungen<br />

� In unterschiedlichen Kontexten (SAP, Mail [Lotus Notes/Domino, MS-Exchange], File-Systeme, …)<br />

� Insbesondere getrieben vom Gedanken: Compliance<br />

� Workflow-Lösungen (unter Beteiligung elektronischer Dokumente)<br />

� Fluß von Dokumenten in Anwendungen (Prozesse)<br />

� Lotus Domino Workflow<br />

� Frühes und spätes Scannen von Dokumenten<br />

Immer wieder die gleiche Frage: Wie finde ich Informationen?<br />

� Metadaten als erster Zugang<br />

� Aber …<br />

� Über Datentöpfe hinweg im gleichen Frontend<br />

� Sicherheit<br />

• robuste Architektur<br />

• Datensicherheit<br />

� Skalierbarkeit (offene, etablierte und dynamische Architektur, die auf Standards beruht)<br />

9<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


<strong>AG</strong>ENDA<br />

01<br />

02<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Beteiligte und Ziele<br />

Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />

03 Technik & Konzepte<br />

04 Einsatzmöglichkeiten, Beispiele<br />

05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />

10<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Kernfrage: Wie finde ich die richtigen Informationen?<br />

Was heißt „richtige Informationen“ finden?<br />

� Wiederfinden einer bestimmten Word-Datei?<br />

� Es geht um die Information in dieser Datei<br />

Die richtige Information ist mehr:<br />

Wer, wie, was, wo, wann, wieviel, warum?<br />

Die Herausforderung für „richtige Informationen“<br />

� Erkennen<br />

� Strukturierte Daten (z.B. Datenbanken etc.): enthalten meist Wer, Wo, Was, Wieviel, Wann (� BI)<br />

� Unstrukturierte Daten (z.B. Word-Dateien, Blogs und Forum-Einträge etc.): Wie & Warum<br />

enthalten ggf. aber auch (und zwar nur hier) das Wer, Wo, Was, Wann und Wieviel<br />

� Automatisiert extrahieren<br />

� Recherchierbar machen<br />

� Analysieren können<br />

� Content Analytics<br />

11<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

Unstrukturierte Daten<br />

so nutzen als wären<br />

sie strukturiert


Wie weit geht Analytics (schon heute)?<br />

Am 16.02.2011 gewann die Quizshow Jeopardy<br />

Breites Wissen aus Politik, Geschichte, Literatur, Kunst,<br />

Unterhaltung, Wissenschaft erforderlich<br />

� Keine einfachen Fragen: Ironie, mehrdeutige Fragen,<br />

subtile Bedeutungsunterschiede, Wortspiele, Rätsel<br />

� Beispiel Kategorie Sprichwörter:<br />

Sogar eine kaputte von diesen<br />

stimmt 2 x am Tag …<br />

Was ist eine Uhr<br />

Spiel-Idee Jeopardy: Verständnis der Frage & das Finden der richtigen<br />

Antwort in möglichst kurzer Zeit<br />

Watson zeigt: eine hochwertige semantische<br />

Suchmaschine ist heute realisierbar<br />

� Sinn komplexer Fragen erfassen<br />

� Auffinden relevanter Informationen<br />

� Bewerten der Informationen<br />

� Mit „abgeschlossenem Wissen“<br />

� Unter Zeitnot<br />

12<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

Ohne Analyse<br />

von Texten kann<br />

ich wenig mit<br />

meinem Wissen<br />

anfangen.<br />

http://www.ibm.com/innovation/us/watson/index.html


Enterprise <strong>Search</strong> und Content Analytics<br />

Auffinden von Informationen<br />

Analysieren von Informationen<br />

� Ansatz „Enterprise <strong>Search</strong>“ � Ansatz Content Analytics<br />

Anreichern von Informationen<br />

Unterschiedliche Ausprägungen des gleichen Themas<br />

Das Gewicht zwischen Suchen und Analytics wird je nach Situation<br />

unterschiedlich sein<br />

� Gut zu wissen: das gesamte<br />

Spektrum wird abgedeckt<br />

� Watson beweist: … wird<br />

erfolgreich abgedeckt<br />

„Einfache Suche“<br />

13<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

„Konzept Suche“


Der Nutzen von Enterprise <strong>Search</strong> und Content Analytics<br />

Informationen aus den 80% (unstrukturierte Daten) nutzen<br />

� Schnelleres Finden von Informationen<br />

� Zusammenhänge aufdecken<br />

� Unbekanntes oder Verborgenes entdecken<br />

� Bessere Entscheidungen treffen: Beweisbar durch Charts, Reports, Direktzugriff bei Management Summary<br />

(Dashboards)<br />

Kosten sparen<br />

� Einfache Suche: ROI-Berechnung<br />

� Analytics: Fehlinvestitionen vermeiden, Folgekosten reduzieren<br />

Kerngeschäft verbessern – Position im Markt verbessern – Profitabler werden<br />

� Zielgenaue Integration in Geschäftsprozesse<br />

� Servicequalität und Kundenansprache erhöhen<br />

� Innovativ sein<br />

� Neue Geschäftschancen entwickeln<br />

14<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


<strong>AG</strong>ENDA<br />

01<br />

02<br />

03<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Beteiligte und Ziele<br />

Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />

Technik & Konzepte<br />

04 Einsatzmöglichkeiten, Beispiele<br />

05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />

15<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Wie arbeitet Content Analytics & Enterprise <strong>Search</strong>?<br />

1. Crawler besuchen die<br />

Datenquellen<br />

Crawler<br />

3. Informationen<br />

werden geparst<br />

und indexiert<br />

UIMAbasierteIntelligenzbausteine<br />

16<br />

18.09.2012<br />

Index<br />

2. Metadaten,<br />

ACL & Content<br />

werden<br />

gecrawlt<br />

Netzwerk<br />

5. Im Index:<br />

Suche nach<br />

Treffern<br />

Textminer-<br />

oder<br />

Such-<br />

6. Ergebnisliste<br />

zurück<br />

anwendung 4. Benutzer<br />

“fragt”<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

Content (intern, ggf. extern)<br />

Webseiten, Filesysteme,<br />

DBen, CMS, DMS, …<br />

7. Benutzer fordert<br />

die Info von der<br />

Quelle


Wo kommt die Intelligenz her? Analytics-Komponenten<br />

Optional: Crawler-Plugin<br />

� „Special-“ Crawlen von „besonderen Daten“<br />

� Anreichern der gecrawlten Daten<br />

Wörter und Phrasen<br />

� Spracherkennung (als Voraussetzung für das Folgende)<br />

� Sequentierung, Lemmatisierung, Normalisierung der Wörter<br />

� Erkennen von „Grammatik“ (Substantiv, Verb, etc.)<br />

Zeichenregeln – Character Rules<br />

Wörterbücher - Dictionaries<br />

� Z.B. Unternehmenswissen in Begriffe gefasst<br />

� Synonymwörterbücher<br />

� Abstraktionen (Wörter � Begriff)<br />

Beziehungen – Parsing Rules<br />

� Erkennen von Mustern und Zusammenhängen<br />

Klassifizierung<br />

Zusätzliche Java-Anwendungen<br />

17<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

Entwickelt mit<br />

Eclipse-Client,<br />

offene API<br />

Out of the Box<br />

(eingeschaltet)<br />

Erstellt mit<br />

Content<br />

Analytics<br />

Studio<br />

(bzw.<br />

Erstellung<br />

unterstützt)<br />

UIMA-konform<br />

Erstellt mit<br />

zusätzl. Mitteln


Modellierungswerkzeug für linguistische Komponenten<br />

Beispiel für Textanalyse<br />

Spracherkennung ► Segmentierung ► Normalisierung ► Anreicherung ► Wörterbücher ► Regeln<br />

Deutsch Einzelne Wörter:<br />

z.B. Ford<br />

Sätze:<br />

z.B. Nun ist aber<br />

die Klimaanlage<br />

kaputt.<br />

Grundform<br />

erkennen<br />

z.B.: gekauft<br />

� kaufen<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

Grammatik<br />

z.B. Reparatur<br />

� Nomen<br />

z.B. Kaufen<br />

� Verb<br />

z.B.<br />

z.B.<br />

a) Fachwörter Ein „Defekt“ ist,<br />

• Klimaanlage wenn „Fachwort“<br />

• Topf<br />

und „Defekt-<br />

Indikator“ in einem<br />

• …<br />

Satz auftreten.<br />

b) Defekt-Indikator<br />

• kaputt<br />

• defekt<br />

• …<br />

z.B.<br />

…Topf ... defekt …<br />

Hallo, ich habe vor 5 Monaten eine gebrauchten Ford Focus beim Händler gekauft.<br />

Nun ist aber die Klimaanlage kaputt.<br />

Ich habe den Wagen erst zum nächsten Fordhändler gebracht.<br />

Er hat dann bemerkt, dass der Topf, der das Kondenswasser auffängt, defekt ist.<br />

Summar summarum würde es sich auf 313 Euro belaufen. Nun ist meine Frage: Wäre<br />

diese Reparatur auch in der Gebrauchtwagengarantie enthalten, oder bräuchte ich<br />

es erst gar nicht versuchen?<br />

Quelle: IBM<br />

18<br />

18.09.2012


Inhalt und „angereicherter“ Inhalt � Zugang für Analytics<br />

Quell-Dokumente Crawl<br />

ACL<br />

Objekt-Metadaten<br />

•••<br />

ACL<br />

Objekt-Meta<br />

daten<br />

19<br />

18.09.2012<br />

typspezifisch<br />

definierter<br />

Crawler<br />

>30 Crawler für<br />

200 Datentypen<br />

Out Of Box<br />

Ggf. eigenes<br />

Crawler-PlugIn<br />

Holt ab:<br />

- Content<br />

(Binärtext)<br />

- Metadaten<br />

(- Security)<br />

Document Processing (P/I) „angereichertes“ Dokument<br />

Sequentielle Verarbeitung<br />

Wörter und Phrasen<br />

• Spracherkennung (als Voraussetzung<br />

für das Folgende)<br />

• Sequentierung, Lemmatisierung,<br />

Normalisierung der Wörter<br />

• Erkennen von „Grammatik“<br />

Wörterbücher<br />

Beziehungen – Rules<br />

Klassifizierung<br />

Regular Expressions<br />

Zusätzliche Java-Anwendungen<br />

(Security)<br />

Dokument-Content<br />

Analysierbare Felder (aus Metadaten)<br />

Mapping auf Facetten<br />

(Security)<br />

Dokument-Content<br />

aus Metadaten<br />

aus Grammatik<br />

aus Konzepten<br />

und Regeln etc.<br />

Analysierbare Felder aus Metadaten)<br />

Mapping auf Facetten<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchwort: Suchmaschine<br />

Chris<br />

Regular Expression: Phone Number<br />

aus Metadaten<br />

aus Grammatik<br />

aus Konzepten<br />

und Regeln etc.<br />

Im Index<br />

Thumbnail<br />

Index<br />

Taxonomy<br />

Index<br />

<strong>Search</strong><br />

Index<br />

Facet Count<br />

Sub Index


<strong>AG</strong>ENDA<br />

01<br />

02<br />

03<br />

04<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Beteiligte und Ziele<br />

Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />

Technik & Konzepte<br />

Einsatzmöglichkeiten, Beispiele<br />

05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />

20<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Datenquellenübergreifende Suche (1)<br />

Ziel: Volltextsuche datenquellenübergreifend, um Informationen<br />

aufzufinden<br />

� Inhalte aus unterschiedlichen Datenquellen (d.h. auch aus unterschiedlichen<br />

Datenquellen-Typen) werden über eine konsolidierte Oberfläche gefunden<br />

Typische Situationen für datenübergreifende einfache Suche sind z.B.<br />

� Erleichterung beim Auffinden von Informationen, deren Ablageort nicht exakt bekannt ist<br />

� mentale Entlastung<br />

� Fehlablagen korrigieren<br />

� Überwinden von Grenzen durch historisch entstandene bzw. technisch begründete<br />

Datencontainer<br />

� Finden von Informationen, deren Existenz dem Anwender gar nicht bekannt ist<br />

� Überblick über Informationen für neue Mitarbeiter schaffen<br />

21<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Datenquellenübergreifende Suche (2)<br />

Seit vielen Jahren sind in einer öffentlichen Verwaltung unterschiedliche Anwendungen<br />

im Einsatz zur Vorgangsbearbeitung- und Dokumentation:<br />

� Im Bauordnungsamt ist seit 1990 eine Fachanwendung BGV (Baugenehmigungsverfahren) im Einsatz,<br />

dort werden alle Datensätze und Dokumente gemäß der Anwendungslogik zwangsweise abgelegt.<br />

Eine elektronische Dokumentation aus der Zeit davor existiert nicht.<br />

� Für Dokumentationen (Gutachterausschuß, Kaufpreissammlung, Pressemeldungen, Stellungnamen zu<br />

Bürgeranfragen etc.) erfolgt die Ablage gemäß Aktenplan<br />

� Seit 2001 in einem elektronischen DMS<br />

� Davor (seit 1984) zunehmend in Ordnerstrukturen gemäß Aktenplan im Windows-Dateisystem<br />

� Aus der Zeit davor sind wichtige Dinge (mit eingetragenen Metadaten) eingescannt und – je nach Erstellung – im DMS<br />

oder im Filesystem abgelegt<br />

� Die Dokumentation der Baulasten erfolgt historisch<br />

� Bis 1985 ausschließlich in Papierform, dies ist alles eingescannt (mit Metadaten) und elektronisch in einem Dateisystem<br />

abgelegt<br />

� 1985-1997 ist alles elektronisch in Dokumenten geführt und im Dateisystem abgelegt<br />

� Ab 1.1.1998 sind die Baulasten im BGV (Fachanwendung s.o.) dokumentiert<br />

� Die Dokumentation der Bauleitplanung erfolgt so:<br />

� Verfahrensteil ist im BGV (Fachanwendung, s.o.) dokumentiert<br />

� Schriftlicher Teil ab Stichtag 1.1. 2004 im DMS, davor im Dateisystem abgelegt<br />

� Zeichnerischer Teil ab Stichtag 1.1. 2004 im GIS (Fachanwendung), davor im Dateisystem abgelegt<br />

Problem: Wie bekommt ein Mitarbeiter rasch die benötigten Informationen zusammen,<br />

wenn er sich in einem Verwaltungsvorgang mit den relevanten Informationen zu einem<br />

bestimmten Thema beschäftigen muß?<br />

22<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Such-<br />

begriff(e)<br />

Treffer-<br />

info<br />

Suche<br />

ein-<br />

grenzen<br />

Datenquellenübergreifende Suche (3): Suchbegriff „Illenau“<br />

Quellentyp<br />

Windows… = Dateisystem<br />

23<br />

JDBC-Dateisystem<br />

18.09.2012 <strong>PROFI</strong><br />

= BGV-BAT-Datei<br />

<strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

Notes = DMS<br />

Pictogramm<br />

Vorschau<br />

In Liste: klein<br />

Bei Klick: größer


Ein Live-Blick auf ICA 3.0<br />

„Sammlung von IT-Texten“ zu unterschiedlichen Themenbereichen<br />

� Im File-System abgelegt nach gewisser thematischer Zuordnung<br />

� Über Jahre hinweg gepflegt<br />

Suchen allein wäre schon hilfreich …<br />

Anreichern der Suche<br />

� Character-Rule<br />

� Hier: Erkennung Mail-Adresse<br />

� Dictionary – Wörterbücher<br />

� Spiegeln den Themenbezug wieder<br />

� Frei definiert und selbst erstellt<br />

� Konzepte � nicht ausgeführt<br />

Erweiterungsmöglichkeiten<br />

� Weitere Datentöpfe<br />

� andere Dokumentablagen im Filesystem<br />

� Archivsystem<br />

� DMS …<br />

� Secure <strong>Search</strong><br />

� Suche berücksichtigt die Benutzerrechte<br />

� Treffer wird nur angezeigt, wenn Leserecht an Quelle besteht<br />

24<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Ein Live-Blick auf ICA 3.0<br />

25<br />

18.09.2012 Annotatoren <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


Erkennen von Zusammenhängen aus unstrukturierten<br />

Daten. Intelligente Wissenserarbeitung (1)<br />

Anreichern von unstrukturierten Informationen durch eigene Wörterbücher und Regeln<br />

Nutzen dieser Strukturen für Analyse � hier: Korrelationen erkennen<br />

�<br />

26<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine<br />

1. Eingestellt:<br />

Facette „Vendor“ � Blick auf Ford<br />

Dazu: Facette „Part Failed<br />

2. Eingestellt:<br />

Facette „Vendor“ � Blick auf Ford<br />

Facette „Part Failed“ � Engine<br />

Mounts Failed<br />

Dazu: Verben


Erkennen von Zusammenhängen aus unstrukturierten<br />

Daten. Intelligente Wissenserarbeitung (2)<br />

Visualisierung der Analysen<br />

� „Bauchgefühl“ zu Zahlen und<br />

Bildern werden lassen<br />

27<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


<strong>AG</strong>ENDA<br />

01<br />

02<br />

03<br />

04<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Beteiligte und Ziele<br />

Die „richtigen“ Informationen, Enterprise <strong>Search</strong> & Content Analytics<br />

Technik & Konzepte<br />

Einsatzmöglichkeiten, Beispiele<br />

05 <strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> – Projekt<br />

28<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> PSA (1)<br />

Angebot der <strong>PROFI</strong> für ein definiertes Set (eine „typische Situation“):<br />

Es wird ein IBM Content Analytics-Paket zu einem Angebotspreis<br />

geschnürt.<br />

Das Paket besteht aus<br />

� der Hardware - als virtueller Rechner oder als physischer Rechner (mit VM),<br />

� den IBM-Lizenzen und<br />

� den <strong>PROFI</strong>-Dienstleistungen,<br />

um damit eine<br />

� realistische, profilierte Anforderung der Kunden im Umfeld Content Analytics & <strong>Search</strong><br />

� in definiertem Zeit-Aufwand und<br />

� mit definierten Kosten<br />

zu lösen.<br />

Das Ziel ist<br />

� den Interessenten/Kunden den Einstieg in ICA zu überschaubarem Aufwand anzubieten.<br />

� ein „konkretes“ und „greifbares“ Paket zur Verfügung zu haben<br />

� ein „Gefühl“ für Projekte, Inhalte und Anforderungen in diesem Bereich zu entwickeln<br />

29<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> PSA (2)<br />

Zusammenstellen der erforderlichen Informationen für die PSA beim Kunden<br />

Systemlieferung der PSA durch <strong>PROFI</strong> mit den Komponenten<br />

� Bereitstellen Rechner<br />

� Software Lizenzen für IBM Content Analytics With Enterprise <strong>Search</strong> Starter Pack<br />

� Herbeiführen der Betriebsbereitschaft der unternehmensweiten Suche als "All on One"-<br />

System mit<br />

� max. drei Standard-Datenquellen (wie z.B. Windows-Filesystem, Share-Point, IBM Connections, IBM Lotus Notes, E-<br />

Mailsystem Exchange/pst-Dateien)<br />

� im Gesamvolumen von max. 600 GB und<br />

� einem Verzeichnis (z.B. Active Directory oder LDAP Domino-Server).<br />

� Installationsbegleitende Schulung der Administratoren und Dokumentation<br />

Die Art der Einrichtung stellt sicher, dass nach Abschluss des Projektes<br />

� die Basis für die unternehmensinterne Suche & Anlayse gelegt ist, insbesondere die Suche<br />

in den o.g. Datenquellen für ca. 30 Benutzer zur Verfügung steht<br />

� sowie weiterführende Arbeiten an der unternehmensinternen Suche & Analyse auf diesem<br />

Stand aufbauen können.<br />

30<br />

18.09.2012<br />

<strong>PROFI</strong> <strong>Search</strong> <strong>Appliance</strong> - Ihr Einstieg in die hausinterne Suchmaschine


VIELEN DANK!<br />

Dr. Michael Kosmowski<br />

Senior Software Berater<br />

Tel.: 0721 46 46 46 – 64 44<br />

E-Mail: m.kosmowski@profi-ag.de

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!