Business Intelligence & Analytics

Aus Cloud Computing Workshop
Wechseln zu: Navigation, Suche

Bei ständig steigendem Datenvolumen ist es nur eine Frage der Zeit bis die Unternehmen in einer Datenlawine ersticken.


  • Wie können diese Big Data Halden effektiv und effizient aufgearbeitet werden?
  • Was sind die Vor- und Nachteile von Business Analytics und wer braucht es überhaupt?
  • Gibt es für jeden eine passende Lösung?


Diese Fragen werden in unserer Präsentation aufgegriffen, mit einem Schwerpunkt auf BA in der Cloud, inklusive Veranschaulichung an einer Live Demo oder einem Video.

Datenmenge.jpg


Wann sind Daten „Big“?[Bearbeiten]

Definition von Big Data[Bearbeiten]

Big Data bezieht sich im Allgemeinen auf drei Arten von Daten:

A. Traditionelle Geschäftsdaten

Hierunter zählen zum Beispiel Daten aus Kundenmanagement Systemen (CRM) oder Daten aus ERP Systemen, die in den meisten Unternehmen zum Einsatz kommen

B. Maschinengenerierte / Sensordaten

Maschinen / Sensoren können in kürzester Zeit eine Masse an Daten produzieren (Ein Flugzeugtriebwerk generiert innerhalb von 30 Minuten 10TB Sensordaten)

C. Social Data

Gerade für die Kundenbindung und den Kundenfang können diese Daten von Bedeutung sein. Hierunter zählen die Daten aus Micro-Blogging Seiten wie z.B. Twitter und Daten aus sozialen Netzwerken, z.B. Facebook.


Es gibt noch weitere vier Charakteristika die Big Data laut Oracle definieren:

A. Volumen: Maschinen generieren weitaus mehr Daten als im traditionellen Arbeitsumfeld.

B. Geschwindigkeit: Pro Tag werden zum Beispiel von den Sozialen Diensten ca. 8TB neue Daten generiert die man sich zur Kundenbindung und zum Report der Kundenzufriedenheit zunutze machen kann.

C. Vielfalt: Traditionelle Datentypen sind im Kontext meist gut beschrieben und verändern sich im Laufe der Zeit nur wenig. Aber: Mit jedem neuen Service, jedem neuen Sensortyp und jeder neuer Marketingkampagne werden neue Datentypen geschaffen.

D. Wert: Der Wirtschaftliche Wert von Informationen variiert stark. Eine Herausforderung beim Handling mit Big Data ist das Herausfiltern von wichtigen, wertvollen Daten aus dem Massendatenstrom um diese zusammenzustellen und zu analysieren.

Fakten zu Big Data – Das digitale Universum[Bearbeiten]

Im Jahr 2010 überschritt die weltweite digitale Informationsmenge erstmals die ein Zettabyte Grenze.

Zum Vergleich: 1ZB = 1.073.741.824 Terabyte

In Abbildung 1 zum Vergleich: Ein Zettabyte ist vergleichbar mit 75 Billionen (75.000.000.000.000) komplett mit Daten beladener iPads. Wenn man diese auf der Fläche eines Fußballfeldes auslegt und nach oben stapelt entsteht ein Turm, der 545,5m hoch ist.

Abbildung 2 zeigt das Verhältnis zwischen einem Terabyte und einem Zettabyte. Das Terabyte ist im Vergleich kaum sichtbar.

Ipads.png Zettabyte.jpg

  • In den nächsten zehn Jahren wird die Dateienanzahl voraussichtlich um das 75fache zunehmen
  • Nur 1/3 der weltweiten Daten ist minimal geschützt
  • 2011 betrugen die Kosten zum Erstellen, Erfassen, Managen und Speichern von Daten nur noch 1/6 der Kosten von 2005
  • Cloud Computing beansprucht geschätzt nur 2% der IT Kosten

Trends im Umgang mit Big Data[Bearbeiten]

Der Umgang mit Big Data ändert das Bild der Business Analytics. Die Vielfalt an Datentypen im Big Data Kontext erschwert das Arbeiten mit traditionellen Business Intelligence Lösungen. Relationale Datenbanksysteme und traditionelle Analysetechniken werden dem Anspruch an Analysen im Big Data Umfeld nicht mehr gerecht werden. Aus diesem Grund tendiert man dazu Analysen in einer NoSQL Datenbank durchzuführen und die Ergebnisse in ein klassisches Datawarehouse zu überführen. NoSQL (Not only SQL) Datenbanken stehen den relationalen Datenbanken gegenüber. NoSQL Datenbanken werden meistens mit dem BASE Akronym charakterisiert:

  • Basically Available: Daten werden auf mehreren Speichern aufgeteilt
  • Soft State: Daten dürfen / sollen inkonsistent sein. Datenkonsistenz ist keine Anforderung an NoSQL Datenbanken
  • Eventually Consistent: Konsistenz wird zu einem späteren Zeitpunkt gewährleistet sein

Beispiele für NoSQL Datenbanken:

Das traditionelle Business Intelligence Reporting wird in Zukunft Experten zufolge zurückgehen. An Bedeutung gewinnen wird dagegen die Predictive Analytics. Es wird von Tag zu Tag wichtiger Geschäftsinformationen ad hoc auszuwerten und künftige Entwicklungen zu simulieren. Hierbei werden leistungsstarke Datenbanken benötigt die dies realisieren können.


Business Analytics[Bearbeiten]

Entwicklung von Business Intelligence / Business Analytics[Bearbeiten]

Das Marktsegment Business Intelligence hat sich in den vergangenen Jahren als sehr dynamisch und auch relativ krisenresistent im Vergleich zum Übrigen IT-Markt erwiesen: Nach wie vor boomt das Geschäft mit und um Business Intelligence. Allein der BI-Software-Markt hat auch im Krisenjahr 2009 in Deutschland laut einer Analyse des Business Application Research Center (BARC) um 8% auf ein Volumen von über 800 Millionen Euro zugenommen.

Vor allem in einem immer dynamischer werdenden Unternehmensumfeld, vor dem Hintergrund eines steigenden Kostendrucks und immer mehr Anforderungen an die Transparenz innerhalb eines Unternehmens nimmt auch die Nachfrage nach geeigneten Informationssystemen zu. Unter der Bezeichnung Management-Support-Systeme oder Management-Informationssysteme wurden die ersten entscheidungsunterstützenden Systeme bereits in den 1960er-Jahren entwickelt. In den 1980er- und 1990er-Jahren entstanden zu diesem Zweck spezielle Konzepte, Technologien und Werkzeuge wie das Data-Warehouse-Konzept, die OLAP-Technologie zur Analyse multidimensionaler Daten oder mathematisch-statistische Verfahren zur Vorhersage von Trends und Zusammenhängen (Data Mining).

Schließlich hat H. Dresner von der Gartner Group für diese Kategorie von Konzepten und Technologien den Oberbegriff Business Intelligence (BI) populär gemacht, der sich seit den 1990er-Jahren weltweit durchgesetzt hat. Allerdings wird der Begriff Business Intelligence nicht einheitlich verwendet: Die Bandbreite geht von einer auf die Werkzeuge zur Analyse von Daten begrenzten Sicht bis hin zu umfassenden, IT-basierten Gesamtkonzepten zur betrieblichen Entscheidungsunterstützung.

Heute gehört BI zum Standardrepertoire eines jeden Großunternehmens, und auch ein großer Teil der mittelständischen Unternehmen setzt Business-Intelligence-Systeme zur Entscheidungsunterstützung ein.

Was ist BA[Bearbeiten]

Die betriebliche Informationsflut zu bewältigen und entscheidungsrelevant aufzubereiten, bildet einen wesentlichen Erfolgsfaktor. Je frühzeitiger wichtige Signale zur Verfügung stehen, desto angemessener kann der Entscheidungsträger handeln. Eine integrierte und zeitnahe Sicht auf Informationen aus allen Unternehmensbereichen ist daher wesentlich. Die Verzahnung und Rückkopplung von strategischen und operativen Entscheidungen gewährt eine Durchgängigkeit der Unternehmenssteuerung, welches folglich zu vermehrtem Share- und Stakeholder Value führt.

Business Analytics ist der Versuch mithilfe von Technologien aus vergangen geschäftsrelevanten Informationen Zusammenhänge zu ziehen und zukünftig im Unternehmen präziser mit Ressourcen zu planen. Während Business Intelligence durch den Einsatz statistischer Methoden vergangene Geschäftsergebnisse misst und bei der Planung unterstützt, soll Business Analytics einen Schritt weiter gehen und bei der Entwicklung neuer Erkenntnisse hinsichtlich der Geschäftszusammenhänge helfen.

Wichtigste Quelle für die Business Analytics sind Daten in Unternehmen, welche mit Methoden aus der Statistik und der quantitativen Sozialforschung analysiert werden, um so eine Prognosse bezüglich relevanter Entscheidungen eines Unternehmens zu unterstützen. Die Ergebnisse der Business Analytics können bei einzelnen strategischen Entscheidungen nützlich sein oder als Grundlage für voll-automatische Entscheidungen in Unternehmen dienen.

Während Business Intelligence sich auf das "Was?" bezieht, wie z.B. "Was passiert in meinem Unternehmen?" fokusieren die Business Analytics auf die Frage "Warum?" - "Warum passiert das in meinem Unternehmen?".

Anwendungstypen von BA[Bearbeiten]

BA beschreibt einen mehrstufigen Analyseprozess, bei dem unterschiedliche Komponenten zum Einsatz kommen. Nicht jedes Unternehmen kann oder möchte alle Bereiche gleichermaßen abdecken. Grundlage des BA-Prozesses bildet im Rahmen der Datenbereitstellung zumeist das Data Warehouse. Hier werden operationale Daten eingespielt, strukturiert und harmonisiert, so dass für die weitere Analyse eine einheitliche und breite Datengrundlage zur Verfügung steht. Ein Data Warehouse gilt mittlerweile als Standard-Komponente von BA-Lösungen.

Im Bereich der Analysesysteme ergibt sich ein heterogenes Bild ab. Den Schwerpunkt bilden Berichts- und Reportingsysteme. Während das sog. Enterprise Reporting auf das unternehmensweite Erstellen und Verteilen von Standardberichten abzielt, ermöglichen Ad-Hoc Query und Analysis Systeme den Anwendern die eigenständige Generierung von Berichten und Abfragen auf Datenbanken. Bereits 2002 waren diese Anwendungsbereiche sowohl im Standard-Reporting als auch bei Ad-hoc-Abfragen als Teile einer BA-Lösung weit verbreitet. Zwischenzeitlich hat ihre Bedeutung weiter zugenommen. Laut einer Studie der Metagroup wird im Bereich des Standardrepotings aktuell mit 69% und zukünftig mit 74% eindeutig den Schwerpunkt von BA-Initiativen gesehen.

Deutlich seltener werden aktuell fortschrittlichere Analysekomponenten wie OLAP (Online Analytical Processing) oder Data Mining eingesetzt, obgleich gerade sie durch anspruchsvolle Modelle komplexe Zusammenhänge aufzeigen, die sich für die Entscheidungsunterstützung als wertvoll erweisen können. Vor diesem Hintergrund wird insbesondere im Bereich OLAP-Detailsanalysen ein ebenfalls stark wachsender Bereich gesehen. Aber auch Data Mining kann immer stärker in den Unternehmen Fuß fassen, insbesondere bei Unternehmen die bereits Reportinglösungen im Einsatz haben.

Mit der stark wachsenden Datenmenge und der Komplexität der Daten steigt darüber hinaus der Bedarf an analytischer Software und Lösungen. Analytische Applikationen gehen über die bisherigen BA-Tools insofern hinaus, als sie die Umsetzung umfangreicher betriebswirtschaftlicher Verfahren und Methoden integrieren (z.B. Balanced Scorecard, Unternehmensplanung, Konsolidierung). Sie umfassen auf der Basis von BA-Technologien implementierungsfähige, sinnvoll konstruierte Standardlösungen, die - wie im operativen Kontext auch - individuell angepasst, und an den konkreten Anforderungen des jeweiligen Unternehmens ausgerichtet werden können.

Einsatzbereiche von BA[Bearbeiten]

Anbieterseitig spielen nach einer Umfrage von Lünendonk vor allem folgende fachliche Themen eine Rolle (sortiert auf einer Skala von 5 („sehr wichtig“) bis 1 („unwichtig“).

  • Finanzmanagement / Controlling (4,9)
  • Risikomanagement (4,1)
  • Business Performance Management (4,1)
  • Customer Relationship Management (3,4)
  • E-Business (3,0)
  • Supply Chain Management (3,0)
  • Supplier Relationship Management (2,9)

Die fachlichen BA-Themen werden unternehmensintern von unterschiedlichen Fachabteilungen getrieben. Als Schwerpunkte des Einsatzes von Business Analytics bezogen auf die Unternehmensbereiche kristallisieren sich in den meisten Untersuchungen übereinstimmend die Bereiche Finanzen / Controlling vor Marketing / Vertrieb heraus. Weitere wichtige Einsatzfelder sind der Einkauf / Logistik sowie das Personalwesen.

Beispiel IBM Watson[Bearbeiten]

Watson.jpg

Mit dem Projekt "Watson" hat IBM ein Computer System gebaut, welches mit einer künstlichen Intelligenz in der Lage war Fragen zu verstehen und Antworten zu geben. Das Ziel, welches sich die Entwickler von Watson dabei gesetzt haben, war es in der Fernsehsendung "Jeopardy" gegen zwei der besten menschlichen Spieler zu gewinnen. Die Herausforderung lag darin, dass in diesem Spiel keine Antworten auf Fragen zu finden, sondern auf die passende Frage zu einer gegebenen Antwort zurückzuschließen.

Watson ist ein Frage-Antwort-System, welches mit Hilfe von verschiedenen Technologien die passende Frage zu einer Antwort findet. Die folgende Grafik gibt einen Überblick über die Schritte, welche das System durchführt. Watson is a Question answering (QA) computing system built by IBM.[2] IBM describes it as "an application of advanced Natural Language Processing, Information Retrieval, Knowledge Representation and Reasoning, and Machine Learning technologies to the field of open domain question answering" which is "built on IBM's DeepQA technology for hypothesis generation, massive evidence gathering, analysis, and scoring."[2]

Beispiel.jpg

Watson kann nicht nur durch schnelle Abfragen Zusammenhänge in der Fragengenerierung prozessieren, sondern berechnet auch die Wahrscheinlichkeit der Richtigkeit der Antwort. Dazu gleicht es Informationen und Daten mit der Antwort und vergangenen Erfahrungswerten aus Berechnungen ab und entscheidet sich je nach Punktestand im Spiel für einen Prozentsatz an Antwortsicherheit ab welchem Watson tatsächlich eine Antwort gibt.

Das folgende Video zeigt genauer welche Berechnungen von Watson durchgefüht werden um eine Antwort zu generieren.

http://www.youtube.com/watch?v=DywO4zksfXw Video: Watson the Science behind an answer

Um die komplexen Analysen duchführen zu können, benötigt Watson große Rechenleistung. Deshalb setzt sich Watson zusammen aus 90 IBM Power 750 Servern, deren 2880 Prozessorkerne und 16 Terabytes Arbeitsspeicher parallel arbeiten, um Ergebnisse innerhalb von 3 Sekunden berechnen zu können.

Auf den ersten Blick wirkt Watson wie ein System, welches keinen Mehrwert für ein Unternehmen bringen kann, jedoch muss man betrachten, dass die Anwendung von Watson auf Jeopary nur ein Beispiel ist. Ein solches Analyse System kann ebenso auf andere Bereiche angewandt werden, welche geschäftlich relevant sind. Beispielsweise wird Watson für die Erkennung von Krankheiten in medizinischen Einrichtungen benutzt und dient dort als Werkzeug für die Diagnosen bei Patienten.

Der Grundgedanke baut auf "Business Analytics" und bedeutet, dass Informationen also sowohl strukturierte als auch unstrukturierte Daten analysiert werden und mit Hilfe von Erfahrungswerten Prognosen gestellt werden können, welche als Grundlage für Entscheidungen dienen sollen.

In der Zukunft kann man sich vorstellen, dass dieser Service aus der Cloud abgerufen wird, da durch die Größe dieser Systeme und unregelmäßiger Belastung es unwirtschaftlich ist, ein solches System vor Ort im Rechenzentrum zu implementieren. Vor allem der Zugriff über mobile Endgeräte kann dabei es möglich machen flexibel vom Ort das System zu nutzen.

Was sind die Kostentreiber[Bearbeiten]

Für viele Unternehmen stellt sich die Frage ob sich die Implementierung eines Business Intelligence und Business Analytics Systems lohnt. Ein Irrtum der dabei häufig aufkommt, ist dass Open Source Systeme kostenlos seien. Dies ist nicht der Fall, denn Open Source bedeutet ledigilich Zugriff auf den Code.

Die wichtigsten Kostentreiber sind neben Lizenzkosten für die Software die Kosten für Hardware und Rechenkapazität. Ein weiterer großer Kostentreiber sind die Anpassungen, die programmiert werden müssen, damit das System auf die jeweiligen Geschäftsszenarien angewandt werden kann. Dieses "Customizing" erzeugt hohe Kosten, da nicht nur Prozesse erkannt und analysiert werden müssen, sondern auch Zusammenhänge definiert und Regeln festgelegt werden müssen.

Weiter Kostentreiber sind verteilte Systeme mit vielen verschiedenen Daten und keinen passenden Schnittstellen. Vor allem unstruktuierte Daten bereiten Probleme bei der Integrierung in die Analysen und zusätzliche Rechenkapazität um in strukturierte Daten prozessiert zu werden.

Der Trend liegt deshalb in besonders benutzerfreundlichen BI-Tools, welche dadurch, dass sie in der Cloud implementiert sind immer auf dem aktuellensten Stand laufen und auf eine ansprechende grafische Obefläche wertgelegt wird.

Wer braucht BA?[Bearbeiten]

der Nutzen eines Business Intelligence / Business Analytics System variiert nach der Intensität. Bei einer intensiven Nutzung über mehrere Unternehmensbereiche hinweg liegt der Nutzen natürlich höher als wenn nur ein Bruchteil des Unternehmens das System für vereinzelte Kennzahlen benutzt. Letztendlich lässt sich jedoch sagen dass jede Firma die KPI benutzt aus einem BA System einen Nutzen ziehen kann. In der Regel werden dadurch folgende Kernpunkte angesprochen:

  • Performance verbessern
  • Energien fokussieren
  • Kosten reduzieren

Der Umfang in dem diese Punkte zu tragen kommen ist nicht pauschal festlegbar sondern hängt von vielen individuellen Faktoren zusammen.

Vorteile von Cloud BA[Bearbeiten]

Folgende Punkte sind mögliche Vorteile die ein BA System in der Cloud hat gegenüber einem proprietären System des Anwenders

  • Skalierung und Wachstum ist in der Verantwortung des Anbieters
  • SLA garantieren das Funktionieren
  • ETL in der Cloud
  • real-time BA einfacher
  • Kosten sind kalkulierbar

Nachteile von Cloud BA[Bearbeiten]

Mögliche Nachteile der Nutzung eines BA Systems in der Cloud sind wie folgt:

  • oft nur Berücksichtigung des Kostenaspektes
  • Erfolg ist schwierig messbar
  • Änderungen im Dateisystem sind schwierig nachzuvollziehen
  • Erhöhte Relevanz der Sicherheitsvorkehrungen

Ausblick für BA und Big Data[Bearbeiten]

Da Big Data wie bereits erwähnt einen zunehmenden Fokus verdient und auch die BA Systeme sich ständig weiter entwickeln haben wir hier einen Ausblick in die nahe Zukunft.

Die Menge an Daten nimmt ständig zu: In den nächsten 10 Jahren wird

  • die Serveranzahl um das 10 fache steigen
  • das Volumen des Datenmanagement um das 50 fache steigen
  • die Anzahl der Dateien um das 75 fache steigen

Aber die Anzahl der IT Professionals steigt nur um das 1,5 fache im gleichen Zeitraum

bis 2015 werden 20 % der globalen Daten in irgendeiner Weise Kontakt mit einer Cloud haben

nur die Hälfte der schützenswerten Informationen sind auch wirklich geschützt

Literaturverzeichnis[Bearbeiten]

Manhart, Dr. Klaus (2011): 'Was bringt Business Intelligence in der Cloud? – Pros und Cons', in http://www.computerwoche.de/cloud-expertenrat/2011/05/27/was-bringt-business-intelligence-in-der-cloud-pros-und-cons/ [Zugriff: 20. Mai 2011]

Biere, Mike (2011): 'The new era of Enterprise business intelligence : using analytics to achieve a global competitive advantage', London 2011

Seufert, A., Oehler, K. (2009): 'Business Intelligence & Controlling Competence - Grundlagen Business Intelligence', 1. Aufl., Stuttgart ; Berlin : Steinbeis-Ed.

Haneke, Uwe (Hrsg.) (2010): 'Open source business intelligence : Möglichkeiten, Chancen und Risiken quellenoffener BI-Lösungen', München ; Wien: Hanser

Microsoft (Hrsg.) (2009): 'Determine business data and business intelligence needs', in http://technet.microsoft.com/en-us/library/cc263217(v=office.12).aspx#section1 [Zugriff: 20. Mai 2012]

International Data Corporation (Hrsg.) (2007): 'The Expanding Digital Universe', in http://www.emc.com/collateral/analyst-reports/expanding-digital-idc-white-paper.pdf [Zugriff: 20. Mai 2012]

CIO.com (Hrsg.) (2011): 'Weltweite Datenmenge übersteigt 2010 ein Zettabyte' in http://www.cio.de/was_ist_cloud_computing/2234666/ [Zugriff: 20. Mai 2012]

Oracle (Hrsg.) (2012): 'Oracle: Big Data for the Enterprise', in http://www.oracle.com/us/products/database/big-data-for-enterprise-519135.pdf [Zugriff: 29.05.2012]

EMC2 (Hrsg.) (2012): 'Digital Universe', in http://germany.emc.com/leadership/programs/digital-universe.htm [Zugriff: 29.05.2012]

Computerwoche (Hrsg.) (2012): 'UPDATE - Datenflut bereitet NoSQL den Weg', in http://www.computerwoche.de/software/software-infrastruktur/2489786/ [Zugriff: 29.05.2012]

Oracle (Hrsg.) (2011): 'Oracle NoSQL Database', in http://www.oracle.com/technetwork/database/nosqldb/learnmore/nosql-database-498041.pdf [Zugriff 29.05.2012]

IBM (2011): 'Jeopardy! Challenge - The DeepQA Project', http://www.research.ibm.com/deepqa/faq.shtml [Zugriff 29.05.2012]

DestinationCRM (Hrsg.) (2009): 'The 4 Hidden Costs of Business Intelligence', http://www.destinationcrm.com/Articles/CRM-News/Daily-News/The-4-Hidden-Costs-of-Business-Intelligence-53941.aspx [Zugriff 29.05.2012]