Fallstudien: Die GCP an der Carnegie Mellon University

An der Carnegie Mellon University wird maschinelles Lernen sozial

Im Articulab der Carnegie Mellon University wollte man verstehen, wie Assistenzroboter mit Menschen zusammenarbeiten können. Dabei sollten sie nicht nur die Aufgaben von menschlichen Assistenten erledigen, sondern auch eine Beziehung zu ihrem Schützling aufbauen. Mit der Machine Learning Engine der Google Cloud hat das Team vom Articulab die Interaktionen zwischen Robotern und Menschen untersucht und den mechanischen Assistenten ein soziales Bewusstsein beigebracht.

Soziale Kompetenzen für künstliche Intelligenz

Beim Annual Meeting of the New Champions 2016 in Tianjin, China, gab es unter anderem ein bemerkenswertes Debüt: SARA (Socially Aware Robot Assistant), eine Roboterassistentin mit Sozialkompetenz, die auf völlig neue Weise mit Menschen interagieren kann. In Tianjin sollte SARA nicht etwa die Rolle menschlicher Assistenten ersetzen oder auf unpersönliche Weise Informationen verarbeiten und weitergeben. SARA war anders: intuitiv, freundlich, interessant und darauf programmiert, mit menschlichen Nutzern "zusammenzuarbeiten". Sie konnte deren Mimik erkennen und darauf reagieren, sich Vorlieben merken und von Nutzern lernen. Außerdem war sie darauf programmiert, bestimmte Signale in der sozialen Interaktion zu erkennen, mit dem Kopf zu nicken und auf den Tonfall zu reagieren.

Ein halbes Jahr später, im Januar 2017, wurde das Projekt beim Weltwirtschaftsforum in Davos in der Schweiz vorgestellt. Es war die einzige Demoversion, die im dortigen Kongresszentrum präsentiert wurde. Die virtuelle Assistentin SARA bot den Teilnehmern z. B. Informationen zu den einzelnen Sitzungen an, machte sie mit relevanten Personen bekannt und empfahl Restaurants.

Ursprünglich diente SARA als virtuelle persönliche Assistentin, die eine ganz bestimmte Aufgabe hatte: Sie bot bei der Konferenz Hilfe an und interagierte mit den Gästen. Bei ihrem Einsatz konnte sie mehr über die Interessen und Ziele der Experten und Politiker erfahren und diesen dann entsprechende Sitzungen empfehlen. Außerdem war es SARA möglich, durch die Unterhaltungen eine Beziehung zu den verschiedenen Gesprächspartnern aufzubauen. So erfuhr sie mehr über deren Vorlieben und konnte in der Folge eine noch individuellere Hilfe anbieten.

Sie wurde von Articulab entwickelt, einem kleinen Team der Carnegie Mellon University. Dieses Team beschäftigt sich mit der Analyse menschlicher Interaktionen in gesellschaftlichen und kulturellen Situationen und nutzt diesen Input für Computersysteme. Die Anwendung in der Robotik soll dann wiederum dabei helfen, menschliche Interaktionen besser zu verstehen. Wie kommunizieren wir mit Technologie und wie können wir diese Kommunikation mit der Zeit verbessern? Die Pflege der Beziehung zwischen Roboter und Mensch ist dabei genauso wichtig wie bei menschlichen Beziehungen. Das Articulab-Team sagte über SARA: "SARA ignoriert die sozio-emotionale Bindung nicht, die die Basis des gesellschaftlichen Zusammenlebens bildet, sondern setzt sie ein, um ihre Kooperationsfertigkeiten zu verbessern."

"Die Google Cloud beschleunigt die akademische KI-Forschung."
Yoichi Matsuyama, Post-Doctoral Fellow am Language Technologies Institute und SARA-Projektleiter

Google-Tools für die Entwicklung von SARA

Das Articulab steht unter der Leitung von Justine Cassell, Associate Dean for Technology Strategy and Impact an der School of Computer Science der Carnegie Mellon University. Dort war man im dank Tools und Finanzierungen für andere Forschungsprojekte schon vor der Arbeit an SARA mit der Google Cloud vertraut. "Da wir TensorFlow bereits bei verschiedenen Aufgaben für maschinelles Lernen eingesetzt hatten, war der Umstieg auf die Google Cloud für unsere Deep-Learning-Projekte ein logischer Schritt", so Yoichi Matsuyama, Post-Doctoral Fellow am Language Technologies Institute und Projektleiter für SARA. "Wir nutzen außerdem eine Reihe von Google APIs wie die Google Speech API (Spracherkennung) für unsere Dialogsysteme und Firebase zum Erstellen eines Framework für die Datenerhebung, das auf Crowdsourcing basiert." Während SARA auf neue Bereiche und Anwendungen ausgeweitet wird, wird die Nutzung der Google Cloud fortgesetzt. "Wir befinden uns noch immer in der Bereitstellungsphase", sagt er und erklärt: "Die Google Cloud beschleunigt die akademische KI-Forschung."

Laut Matsuyama wird Compute Engine im Labor "sehr häufig genutzt", unter anderem GPU-Instanzen mit vier Nvidia Tesla K80 und TensorFlow. Dieses Jahr hat das Team an Modellen wie "Deep Reinforcement Learning-Based Social Reasoning in Task Contexts" und "Socially Conditioned Natural Language Generation" gearbeitet.

Die Analyseergebnisse des Testlaufs von SARA 1.0 – wie sie beim Weltwirtschaftsforum vorgestellt wurde – beschreibt Matsuyama so: "Über 250 Teilnehmer haben SARA bei der viertägigen Konferenz ausprobiert. Insgesamt war der Test also erfolgreich. Allerdings sind wir noch dabei, die Ergebnisse zu analysieren. Was genau lief gut, was war schlecht?" Matsuyama fügt hinzu: "Eine wichtige Erkenntnis aus den Daten ist, dass das, was wir "Rapport" nennen – die emotionale Bindung –, sich darauf auswirkt, wie erfolgreich SARA Aufgaben lösen kann. In Davos hatte die emotionale Bindung zum Beispiel Einfluss auf die Akzeptanz der Empfehlungen. Bei hohem Rapport konnte SARA eine gute Beziehung zum Nutzer aufbauen und ihre Empfehlungen wurden eher akzeptiert. Das ist bisher unsere wichtigste Erkenntnis, aber wir analysieren die Daten noch."

Neue Anwendungsbereiche – Schulen

Es sieht so aus, als hätte die Arbeit von SARA gerade erst begonnen. Andere Anwendungen der "künstlichen Intelligenz mit Sozialkompetenz" von Articulab sind für den Einsatz im Bildungsbereich gedacht, um dort beispielsweise Kinder in öffentlichen Schulen mit wenig Ressourcen zu unterstützen und die Kooperation in den Klassen zu fördern – etwas, das erwiesenermaßen für den Lernerfolg unerlässlich ist. Außerdem hilft die KI Kindern mit hochfunktionalem Autismus oder Asperger-Syndrom dabei, soziale Fähigkeiten zu üben und so die Beziehung zu Gleichaltrigen zu verbessern.

Laut Michael Madaio, Doktorand am Human-Computer Interaction Institute und Leiter des Projekts "Rapport-Aware Peer Tutor" (RAPT) zeigen die Daten, die sie beim Mensch-zu-Mensch-Tutoring zwischen Gleichaltrigen gesammelt haben, dass das "Verhältnis zwischen den Studenten starken Einfluss auf ihre Motivation hat sowie auf ihre Fähigkeit, Probleme zu lösen und letzten Endes auf ihre Art zu lernen" hat. Mit anderen Worten: Vom gemeinsamen Arbeiten profitieren alle.

Während sie weiter daran arbeiten, den Einfluss von emotionaler Bindung auf die Lernbereitschaft besser zu verstehen und ihre Erkenntnisse in die Anwendungen für den Bildungsbereich einzubinden, geht es laut Madaio darum, Tools bereitzustellen, die Schülern und Studenten nicht nur beim Lernen helfen. "Lernplattformen gibt es schon. Aber Studenten sind keine Maschinen, die nur Zahlen verarbeiten" sagt er. "Die soziale Komponente – die Beziehung zu anderen Studenten – ist sehr wichtig. Das gilt auch für das Verhalten zwischen einem virtuellen Tutor, der Feedback gibt, und dem, der das Feedback erhält. Wenn der Tutor jemandem sagt, dass etwas falsch ist, wie macht er das? Wahrscheinlich würde man da am Anfang höflicher und weniger direkt sein, um die Kritik etwas abzumildern. Aber mit der Zeit baut sich zwischen dem virtuellen Tutor und seinem Schützling eine Beziehung auf und das Feedback kann etwas direkter werden. Dann werden auch konkrete Rückmeldungen möglich, die wirklich weiterhelfen."

Wenn ein virtueller Tutor erfolgreich ist, dann erhöht man damit die "Wahrscheinlichkeit, dass Studenten sich mit Fragen an ihn wenden", fügt er hinzu. Das ist wichtig. Entscheidend ist auch der Grad an Motivation. "Es geht nicht nur darum, ob sich die Studenten hier Hilfe holen, wichtig ist auch, wie sie mit dem virtuellen Tutor interagieren. Sind sie offener? Fühlen sie sich sicher genug, um mehr über ihre Lernziele und Ängste zu erzählen?" Dabei geht es um emotionale Bindung, wie bei jeder anderen Beziehung, die sich mit der Zeit erst entwickeln muss. Das Erstaunliche ist aber – und das hat SARA bewiesen –, dass so eine emotionale Nähe entstehen kann.

Bisher waren die Reaktionen auf Anwendungen im Bildungsbereich durchaus positiv. Doch Madaio erklärt: "Bisher haben wir das Ganze noch nicht an einer Schule eingesetzt. Dieses Jahr stehen wir unter anderem vor der Herausforderung, eine umfassende Implementierung zu planen." Das Team will sich dabei zunächst ein Bild davon machen, wie ein solches zukünftiges Einsatzszenario aussehen könnte, beispielsweise als Unterstützer bei Hausaufgaben oder als Lesetutor für Schüler, die sich mit dem Lesen schwertun.

Obwohl es an der Carnegie Mellon derzeit keine Absicht gibt, virtuelle Tutoren einzusetzen, kann sich das Team vorstellen, auch dort einen persönlichen Assistenten einzuführen, der Studenten zum Beispiel über Vorlesungen auf dem Campus informiert oder ihnen Veranstaltungen vorschlägt. Das ehrgeizigste Ziel von Articulab ist es, eine Version von SARA zu entwickeln, die nicht nur bei einer viertägigen Konferenz arbeiten, sondern rund um die Uhr und in verschiedenen Bereichen eingesetzt werden kann. Das ist zwar eine anspruchsvolle, aber auch sehr spannende Idee, die viel Potenzial in sich trägt.

"Es geht nicht nur darum, ob sich die Studenten hier Hilfe holen, wichtig ist auch, wie sie mit dem virtuellen Tutor interagieren. Sind sie offener? Fühlen sie sich sicher genug, um mehr über ihre Lernziele und Ängste zu erzählen?"
Michael Madaio, Doktorand, Human-Computer Interaction Institute

Profil der Organisation

Im Jahr 1900 gründete Andrew Carnegie die Carnegie Technical School. 1912 wurde die Einrichtung zum Carnegie Institute of Technology umbenannt und bot nun vierjährige Studiengänge an. Über 50 Jahre später gab es einen Zusammenschluss mit dem Mellon Institute of Industrial Research, aus dem die Carnegie Mellon University entstand – eine globale Forschungsuniversität in Pittsburgh im US-Bundesstaat Pennsylvania. Die Universität ist bekannt für ihre hochkarätigen interdisziplinären Studienprogramme, unter anderem im Bereich Kunst, Wirtschaft, Informatik, Ingenieurswissenschaften, Humanwissenschaften, Rechtswesen und Naturwissenschaften. Die CMU hat über 14.000 Studenten aus mehr als 100 Ländern.

Genutzte Produkte