Beitrag zum Vortrag "SAP goes Open Source - Eine SAP-Schnittstelle zu Pentaho" von Stefan Müller Wie bindet man SAP zu Auswertungszwecken an Business Intelligence-Lösungen an? ERP-Systeme wie SAP erzeugen sehr detaillierte operative Daten entlang der Geschäftsprozesse. Für die Fachabteilungen ist ein hoher Detaillierungsgrad durchaus erwünscht. Um aber die Unternehmensstrategie überwachen zu können (sowohl die Steuerung des gesamten Unternehmens als auch einzelner Bereiche), müssen die Informationen stark verdichtet und mit Daten aus anderen Systemen angereichert werden. Dazu werden normalerweise Kennzahlensysteme eingesetzt. Mit ihnen kann man überprüfen, ob man seine strategischen und operativen Ziele erreicht hat. Die verwendeten Kennzahlen müssen aber a) einen inhaltlichen Bezug zu den Zielen haben und b) wirtschaftlich in der Erhebung sein. ERP-Systeme enthalten sehr viele der zur Kennziffernberechnung notwendigen Daten. Sie sind daher eine zentrale Datenquelle für die analytischen Instrumente der Unternehmenssteuerung. Wie geht man nun mit dieser Datenfülle um? Normalerweise wird sie aus dem ERP (SAP, Microsoft, ProAlpha, Infor, Abas usw.) extrahiert und in ein separates Data Warehouse geladen. Dort werden sie mit Daten aus weiteren Quellen integriert, um daraus anschließend die Kennzahlen zu berechnen. Durchgeführt wird das mit speziellen Software-Werkzeugen, so genannten ETL-Tools (Extraction, Transformation, Loading). Erst mit ihnen lassen sich Unternehmensdaten für Berichte, Analysen und letztendlich auch Kennzahlensysteme aufbereiten. Für uns am meisten interessant sind natürlich Open Source-Vertreter dieser Software-Kategorie. Welche Schnittstellen zu SAP bieten quelloffene ETL-Tools? Der berühmteste und älteste Vertreter im Open Source ETL-Bereich ist die Datenintegrationssoftware von Pentaho (manchem noch unter dem Namen Kettle bekannt). Bis zur Version 4 gab es die SAP-Konnektivität nur als kostenpflichtiges Plug-In. In der aktuellen Version ist sie in die Community Version integriert und in mehreren Input-Komponenten vorhanden. Eine dieser Komponenten ist von it-novum entwickelt, der ITN Connector ERP. Der Konnektor ist auf die Datenextraktion aus SAP-Tabellen spezialisiert und ermöglicht unter anderem eine Spalten- und Zeilenfilterung direkt in der Schnittstelle selbst. Auf diese Weise kann der Anwender sofort die Datenmenge eingrenzen: Er legt z.B. fest, dass nur Daten ab dem Jahr 2010 extrahiert werden sollen. Daten, die man nicht braucht, müssen also gar nicht erst in die Software geladen werden, um sie im nächsten Folgeschritt wieder „wegzufiltern“. Technologisch gesehen arbeitet der ITN Connector ERP mit dem Java Connector (JCO) von SAP. Auf die SAP-Daten greift die Schnittstelle über einen Remote Function Call zu. Diese Komponente gibt es nicht nur für Version 4.0 der Pentaho Data Integration, sondern auch für die ältere Version 3.2. PDI 4.0 enthält neben der it-novum-Schnittstelle noch einen zweiten Konnektor, mit der man in einem Zwischenschritt des ETL-Prozesses flexibel BAPIs in SAP aufrufen kann. ETL-Werkzeuge aus der Open Source-Welt können SAP-Daten mit verschiedenen Methoden verarbeiten. Mit dem ITN Connector ERP lassen sich viele mögliche Einsatzszenarien abdecken. Die SAP-Konnektivität ist dabei kostenfrei verfügbar (Download unter http://www.it-novum.com/sap-open-source/sap-pentaho-schnittstelle.html). Leistungsfähige ETL-Tools können jedoch immer nur ein Teil die erfolgreiche Nutzung von SAP-Daten sein. Fundierte Kenntnisse des SAP-Systems an sich sowie Erfahrung beim Aufbau von Data Warehouses bzw. OLAP Cubes sind mindestens genauso wichtig, um die Daten sinnvoll und zielführend weiterverarbeiten zu können.