Googles experimentelles NotebookLM macht es unter anderem möglich, aus einem Blogpost einen Podcast im “Talk Radio”-Format zu erstellen. Ein unterhaltsames und niedrigschwelliges Format, aber nicht unbedingt fachlich genau – wie die folgende Analyse zeigt.
– – –
Im Nachgang zu unseren SCIL Trend- Community Days publizieren wir jedes Jahr eine Nachbetrachtung zur Veranstaltung. In diesem Jahr war dies ein umfangreicher Blogpost zum Thema “Kompetenzen für Arbeits- & Lernwelten mit GenKI”. Diese Nachberichte werden geschätzt. Aber: Nicht alle Menschen lesen gerne; manche hören lieber.
Neue Werkzeuge wie Googles NotebookLM (Benutzerkonto bei Google erforderlich) oder Recast bieten uns jetzt hierzu neue Möglichkeiten.
NotebookLM
NotebookLM ist ein von Google entwickeltes, experimentelles KI-Notizbuch. In dieses Notizbuch kann man bis zu 50 Quellen (Dokumente, Webseiten, Videos) einstellen und diese dann bearbeiten. Grundsätzlich ist dies auch mit anderen GenKI-Anwendungen wie ChatGPT, Claude oder Gemini möglich. Aber, diesem Bericht von Datacamp.com zufolge besteht ein wichtiger Unterschied darin, dass NotebookLM den Fokus auf diese Dokumente nicht verliert. Auf der Grundlage der eingestellten Dokumente kann man dann Zusammenfassungen erstellen lassen, “Study Guides” (mit Fragen), FAQs, Audio-Zusammenfassungen und auch Podcasts.
Ein Podcast zum SCIL Trend- & Community Day 2024
Diese zuletzt genannte Variante habe ich jetzt einmal anhand unseres Nachberichts zum 11. Trend- & Community Day ausprobiert. Dieser Nachbericht ist für einen Blogpost vergleichsweise umfangreich (ca. 5 Minuten Lesezeit). Mit NotebookLM konnte ich sehr schnell und einfach eine gut 9 Minuten lange Podcast-Version erstellen lassen, die man z.B. auch beim Autofahren oder beim Spazierengehen hören kann:
Bei dem so erzeugten Podcast führen zwei von der KI erzeugte “Moderator:innen” (eine männliche, eine weibliche Stimme) ein Gespräch zu den Inhalten des Blogposts. Das Ganze hat das Format von US-amerikanischen ‘Talk radio’-Sendungen und die beiden haben erkennbar Spass am Gespräch. Das Gespräch ist informell und unterhaltsam, aber nicht unbedingt auf fachliche Präzision ausgerichtet.
Die Qualität der Stimmsynthese erscheint mir sehr gut. Und das Gespräch zwischen den beiden wirkt lebendig. Der ursprüngliche Blogpost ist in deutscher Sparche geschrieben, wird aber problemlos in einen englischsprachigen Podcast übersetzt. Allerdings: Mit Abkürzungen kommt die Anwendung nicht gut zurecht und spricht beispielsweise GenKI englisch aus, statt diese in ein GenAI zu transformieren. Zudem ist es aktuell nur möglich, solche Podcasts in englischer Sprache erstellen zu lassen.
Was zeigt ein genauerer Vergleich?
Ein Abgleich zwischen dem ursprünglichen Blogpost und dem Podcast zeigt folgendes:
Die Qualität des Podcasts als Audio-Format ist aus meiner Sicht sehr gut. Die fachliche Genauigkeit ist allerdings nicht immer gegeben. Beispielsweise wird aus “metakognitiven Aspekten” im Text “critical thinking” im Podcast; aus dem “Handlungsfeld ‘Veränderungen der Arbeitswelt meistern'” wird “culture of experimentation and collaboration”; aus “Prompt-Bibliothek” wird “prompt cheat sheets”; und aus “lernOS” werden “support groups”. Allerdings: diese Unschärfen oder “Halluzinationen” passen gut in den grösseren Diskussionszusammenhang, dem unsere Veranstaltung und der Blogpost zuzuordnen sind. Vermutlich könnte dies auch bei der Produktion einer Radiosendung mit echten Moderator:innen so passieren – es sei denn, es würde sich um eine Wissenschaftssendung mit hohem fachlichem Anspruch handeln.
Erstaunlich ist das Weltwissen, das NotebookLM einbringen kann. Im Blogpost ist die Abkürzung SBB nicht erklärt und es wird auch nicht erwähnt, dass SBB ein grosses Unternehmen mit vielen Mitarbeitenden ist (aktuell ca. 35’000). Beides wird aber im Podcast angesprochen (“Swiss Railway Company”, “scale”).
Hier eine Übersicht mit vergleichenden Beobachtungen zu den beiden Formaten, die ich für mich zur besseren Einschätzung von NotebookLM zusammengestellt habe:
Ein Experiment mit Potenzial
Google positioniert das Produkt bzw. den Service “NotebookLM” ausdrücklich als “Experiment”. Mit NotebookLM kann man bisher neben Inhaltsverzeichnissen, Zusammenfassungen oder Arbeitshilfen auch sehr unterhaltsame, aber auch sehr amerikanisch wirkende Podcasts im ‘Talk radio’-Format erstellen. Bisher sind bei diesen Podcasts allerdings nur Produktionen in englischer Sprache möglich. Und Konfigurationsmöglichkeiten (etwa bezüglich der Tonalität des Podcastst) gibt es ebensowenig wie die Möglichkeit einer Nachbearbeitung (etwa um bestimmte Formulierungen nachträglich zu korrigieren).
Aber dass dieses Erstellen eines dialogischen Podcasts aus einem Textdokument überhaupt in dieser Qualität möglich ist, ist im ersten Moment sehr beeindruckend. Im Kontext von (betrieblicher) Bildung erscheint mir das Einsatzspektrum für solche Podcasts aktuell auf das unterhaltsame, niedrigschwellige informieren zu fachlichen Themen beschränkt. Aber immerhin…
[…] (10.11.2024): siehe auch „Ein Podcast zum SCIL Trend- & Community Day 2024“ (Christoph Meier, scil, […]