Wiki

Clone wiki

BMCr / Projektdokumentation

#Projekt: Business Model Crunching (BMCr)

Die Projektdurchführung fand im Rahmen des Jahresprojektes am Hermann Hollerith Zentrum (HHZ) in Böblingen als Teil des Masterstudiengangs Services Computing der Hochschule Reutlingen statt. Das Projektteam bestand aus fünf Masterstudenten und einem lehrenden Professor des HHZ, welcher als Teambetreuer und Coach fungierte. Das Projekt wurde im Sommersemester 2016 (SS16) und Wintersemester 2016/2017 (WS16/17) bearbeitet. Am Ende des SS16, wurden der Zwischenstand des Projektes am 30.09.2016 im Rahmen des Projekttages am HHZ präsentiert. Am Ende des WS16/17 folgte die finale Präsentation der Ergebnisse im Rahmen des Projekttages am 24.04.2017 am HHZ.

Zur Projektorganisation wurden die Tools Bitbucket, Trello und HipChat von Atlassian verwendet.

Als Einstieg in das Thema Business Model Crunching wurden gemeinsam mit dem Teambetreuer die Hintergründ und Relevanz des Themas initial geklärt, um eine gemeinsame Arbeitsgrundlage zu schaffen.

Um das weite Themenfeld einzugrenzen, wurden von den Projektmitgliedern zunächst relevante Themen zur Bearbeitung vorgeschlagen und in einem zweiten und dritten Schritt priorisiert, um das für die Projektteilnehmer relevanteste und auch interessanteste Thema auszuwählen. Das ausgewählte Thema "Bestehende Geschäftsmodelle als Ausgangsbasis nehmen und diese permutieren" wurde in einem Software Proposal konkretisiert. Im Weiteren wurde die Entwicklungsmethode für die Softwareentwicklung definert und festgehalten, dass es sich beim Projekt um ein "agiles Data Science Projekt" handelt. Konkret bedeutet dies, dass das Projekt zwei Projekttypen umfasst:

  • BMCr ist ein Data Science Projekt, d.h. die Verarbeitung von mglw. unbekannten, schwierigen Daten soll helfen, ein konkretes Problem zu lösen und den Erfolg messbar nachzuweisen.
  • BMCr ist ein agiles Projekt, d.h. die Planung und Umsetzung finden inkrementell statt.

Folgender Scope wurde zu Beginn des Projektes durch das Projektteam festgelegt:

  • Computergestützte Generierung von (Lean) Canvas-basierten Geschäftsmodellen unter Verwendung von Information aus bereits bestehenden Geschäftsmodellen / (Lean) Canvas

Folgende Ziele wurden definiert:

  • Geschäftsmodelle schneller aufstellen und einschätzen bzw. bewerten
  • Vorhandenes Wissen aus bereits bestehenden Geschäftsmodellen wiederverwenden oder als Inspiration nutzen
  • Datengetriebene Geschäftsmodell-Exploration ermöglichen, d.h. viele Alternativen durchprobieren
  • Maschinelle Unterstützung bei der Erstellung von Modellen, z.B. durch Empfehlungen und automatischer Ergänzungen

Diverse Werkzeuge und Sprachen wurden auf ihre Relevanz zur Erstellung eines Prototyps des Recommender Systems durch das Projektteam geprüft und ausgewählt.

Verschiedene aufeinander aufbauende Releases des Recommender Systems wurden entworfen und umgesetzt. In einem ersten Release wurden mögliche Datenquellen für Canvas Modelle identifiziert. Es wurde entschieden Lean Canvas Modelle von canvanizer.com zu crawlen und die Modelle in einer eigenen Datenbank zu speichern. Dafür wurde eine eigene Anwendung entwickelt. Die Modelle in der Datenbank wurden anschliessend auf ihre Qualität geprüft, um die geeignetsten Modelle für das Recommender System zu identifizieren. Kriterien für die Qualität waren unter anderem die Sprache, in der die Modelle angelegt wurden und die Wortanzahl in den einzelnen Canvas Feldern.

In einem zweiten Release wurden die Texte in den Canvas Modellen in der Datenbank weiter verarbeitet, um sie für ein Recommender System nutzbar zu machen. Drei Verfahren wurden dazu angewandt:

  1. Durch das Stemming der Worte, werden alle Worte auf ihren Wortstamm zurückgeführt.

  2. Füllwörter wurden entfernt, um irrelevante Worte aus den Canvas Feldern zu entfernen.

  3. Wörter wurden um Synonyme angereichert, um eine höhere Reichweite bei den Wortvergleichen zu erzielen.

Im dritten Release werden die vorbereiteten und bereinigten Daten genutzt, um daraus Vorschläge zu generieren. Diese Vorschläge werden mithilfe Languages Models aus den vorhandenen Daten extrahiert. In diesem Projekt kommt das Vector Space Model zum Einsatz, welches über den Ähnlichkeitsalgorithmus tf-idf die gespeicherten Canvases mit den Usereingaben vergleicht. Das Model wird über eine Gensim-Implementierung realisiert.

Die so ermittelten Vorschläge werden in der Anwendung über eine Lean Canvas nach der Eingabe durch den User visualisiert. Das Gerüst der Lean Canvas wird von canvanizer.com eingebunden und über eine API mit den berechneten Vorschlägen gefüllt.

Folgende Publikationen wurden im Zuge des Projektes erstellt: Publikationen

Applikations-Repositories

Die im Verlauf des Projektes entwickelten Anwendungen können über folgende Links heruntergeladen und in eine eigene Bluemixumgebung delpoyed werden. Voraussetzung hierfür ist ein aktivierter Bluemix-Account. Anleitungen und Informationen zur Installation finden Sie hinter den Links.

Canvas Crawler Repository

Gensim Application Repository

Updated