Nachfolgend die Antworten im Original.
SPRINGER NATURE
LLMs must be trained on existing media content. Will Springer Nature’s AI be trained on Springer Nature’s content?
At the moment, our focus is on how we can best use AI internally to help researchers get published faster and find relevant content more quickly, make sure research can be trusted and to reduce barriers to equity. We have been using AI for over 10 years already in support of these goals. Regarding LLMs, we do not currently license our content to third-party LLM providers for the purpose of training their models.
It is, though, a fast-moving area, and we are always open to things which will improve the experience for our customers and the wider research community. Therefore, should this change, we will apply the same considerations we have to date – does it benefit our customers and the wider research community? Is there a ‘human in the loop’? Does it meet our AI governance principles of fairness, transparency, accountability, and respect?
VOGEL
Haben Sie Maßnahmen zum Schutz Ihrer Inhalte vor dem Text und Data Mining durch KI-Anbieter getroffen? Und falls ja welche?
Wir haben auf allen unseren Contentportalen Registrierungs- und Paywalls installiert. In unseren AGB weisen wir darauf hin, dass unser Content nicht für Data Mining genutzt werden darf – nach § 44b UrhG.
Ist die Lizensierung von Buch- oder sonstigen Inhalten für Ihr Unternehmen relevant/ein Thema? Falls ja, wie nähern Sie sich dem Thema, wo stehen Sie dabei?
Das Thema ist aktuell für uns nicht relevant.
Sind Sie in konkreten Verhandlungen mit KI-Anbietern? Oder haben Sie gar entsprechende Deals bereits abgeschlossen?
Nein
VNR GROUP
Geschäftsführungs-Mitglied Michael Schrader:
Grundsätzlich überwiegen für uns die Chancen durch den Einsatz von KI, um die Funktionen und die Benutzererfahrung unserer Leser weiter zu verbessern. Wir schützen weiterhin unseren Content bzw. unser Fachwissen als einen unserer wichtigsten Assets, aber das war auch bisher schon so. Wir sehen hier keine grundlegende Änderung zur Situation „vor KI“. Wir planen aktuell keine Lizenzdeals mit KI-Anbietern, sondern sehen uns als Medienunternehmen in der Rolle unsere Lösungen mit KI zu verbessern. D.h. wir sehen uns auch als Anbieter von KI-Lösungen und nicht als Content-Lieferant.
David Gerginov:
Haben Sie Maßnahmen zum Schutz Ihrer Inhalte vor dem Text und Data Mining durch KI-Anbieter getroffen? Und falls ja welche?
Unsere Produktinhalte, einschließlich der Informationsdienste und digitalen Produkte, sind durch Login- oder Paywall-Schranken geschützt und somit nicht frei zugänglich. Darüber hinaus setzen wir branchenübliche User-Agent-Sperren ein, um unerwünschtes Crawling durch KI-Anbieter zu verhindern. Sollte es dennoch zu einem Missbrauch kommen, reagieren wir mit gezielten Gegenmaßnahmen, um unsere Inhalte zu schützen“.
Sind Sie in konkreten Verhandlungen mit KI-Anbietern? Oder haben Sie gar entsprechende Deals bereits abgeschlossen?
Mit OpenAI haben wir einen Auftragsverarbeitungsvertrag (AVV) abgeschlossen bzw. nutzen die LLMs ohne Weitergabe von Daten auf europäischen Servern, um KI-basierte Produkte und Projekte zu entwickeln, ohne dabei Daten weiterzugeben. Ein konkretes Beispiel ist die Nutzung der Technologie durch unser Tochterunternehmen PressMatrix. Sie integriert auf diesem Weg in Content-Angebote Chatbots und Feature wie Zusammenfassen oder Vorlesen von Texten. Zusätzlich haben wir auch eine Kundenservice-Kontaktanalyse und einen Kundenservice-Wissenbot entwickelt und nutzen KI-Unterstützung bei Übersetzungen, Content-Zusammenfassungen o.ä..
HAUFE
Wir sind diesem Thema noch in internen Entscheidungsprozessen und würden daher dazu momentan keine Stellungnahme abgeben.
WILEY
Wiley believes that AI has the potential to transform knowledge-based industries and that it is in the public interest for these emerging technologies to be trained on high-quality, reliable information. To this end, we have entered into select agreements to leverage previously published content for training LLM models and vertical-specific external and internal applications.
Wiley is committed to protecting authors’ and copyright holders’ rights. As with any commercial arrangement for the use of Wiley-published content, Wiley compensates its partners (e.g., book authors, publishing partners) in accordance with the contractual terms.
dtv
Wir schließen zum jetzigen Zeitpunkt keine Licensing-Deals ab oder entwickeln Modelle dazu.
All unsere eBooks sind mit einem passiven textlichen Opt-Out versehen: Wir haben seit Kurzem auch ein aktives maschinenlesbares Opt-Out in den Metadaten all unserer eBooks verankert.
WESTERMANN
Die Lizensierung von Inhalten an KI-Anbieter ist für uns kein Thema und wir beabsichtigen auch keine entsprechenden Lizenz-Deals. Verschiedene Schutzmaßnahmen für unsere Texte vor dem Zugriff durch KI-Anbieter haben wir getroffen, die ich Ihnen aber nicht im Detail darlegen kann.
WOLTERS KLUWER
Wir wissen um den Wert unserer proprietären Inhalte und ergreifen Maßnahmen, um diese zu schützen.
Es ist uns bewusst, dass KI-Unternehmen die Inhalte von Contentanbietern lizensieren und wir verfolgen diese Entwicklung sehr genau.
Derartige Vereinbarungen sind sehr komplex und müssen von allen Seiten genau durchleuchtet werden, bevor man sie eingeht.
CORNELSEN
Wir verfolgen das Thema Lizenzierung zurzeit nicht aktiv, sondern fokussieren uns darauf, unsere Daten und Inhalte mit eigenen KI-Funktionen zu verbinden – selbstverständlich in enger Absprache mit den Autorinnen und Autoren. Grundsätzlich sehen wir unsere hochwertigen Inhalte und Daten als Kernressource unseres Unternehmens, weshalb wir sie nicht in das Training von KI-Lösungen von anderen Anbietern einbringen möchten.
Zum Schutz: Rechtlich haben wir einen Nutzungsvorbehalt (§ 44b Abs. 3 UrhG) auf Websites und in Produkten. Wenn wir KI-Modelle als Service einkaufen und nutzen, etwa per API, achten wir darauf, dass die Anbieter garantieren, unsere Eingabedaten nicht für das Training ihrer Modelle zu nutzen.
DE GRUYTER BRILL
Haben Sie Maßnahmen zum Schutz Ihrer Inhalte vor dem Text und Data Mining durch KI-Anbieter getroffen? Und falls ja welche?
Ja, es gibt Sicherheitsmaßnahmen. Wir überwachen auf unseren Websites den Datenverkehr und ungewöhnliches Verhalten, um unbefugtes Crawling zu erkennen und wir haben Beschränkungen in unserem Backend eingerichtet.
Ist die Lizensierung von Buch- oder sonstigen Inhalten für Ihr Unternehmen relevant/ein Thema? Falls ja, wie nähern Sie sich dem Thema, wo stehen Sie dabei? Sind Sie in konkreten Verhandlungen mit KI-Anbietern? Oder haben Sie gar entsprechende Deals bereits abgeschlossen?
Wir haben uns entschieden, zusätzlich zur Entwicklung unserer eigenen KI-Expertise, Partnerschaften mit KI-Anbietern einzugehen. Wir tun das, um aktiv gestalten und verhandeln zu können, wie und wann von uns publizierte Forschung bei der Entwicklung generativer KI verwendet wird, und um sicherzustellen, dass die von De Gruyter Brill veröffentlichten Titel auf verantwortungsvolle und nachhaltige Weise genutzt werden. Unser Ziel sind Partnerschaften, die uns als Verlag und unseren Autor*innen zugutekommen, die unsere Position als Teil und Fürsprecherin der Wissenschaftsgemeinschaft gegenüber Technologieanbietern stärken, und die dazu beitragen, dass akademische Forschung ihren Einfluss in einer sich wandelnden Welt so gut wie möglich geltend machen kann. Wir gehen davon aus, in den kommenden Monaten und Jahren Vereinbarungen mit mehreren Anbietern von KI-Technologie abzuschließen.
Falls Lizensierung ein Thema für Sie ist: Welche Teile Ihres Katalogs kommen am ehesten in Frage?
Es können, je nach Verhandlungspartner, bestimmte Teile des Verlagsprogramms oder nahezu das gesamte Programm in Frage kommen.
Wie schätzen Sie die Bereitschaft bei Ihren Autoren ein, solche Licensing-Deals abzuschließen? Haben Sie die Rechte für solche Licensing-Deals in Ihren Autorenverträgen abgedeckt?
Wir haben unsere Autorenschaft proaktiv über unsere grundsätzlichen Pläne informiert und Autorinnen und Autoren, die uns vertraglich bisher nicht das Recht einräumen, ihre Inhalte für das Training von KI zu nutzen, um ihre explizite Zustimmung gebeten. Sehr viele haben bereits zugestimmt. Andere möchten Ihre Inhalte nicht freigeben. Wo es Bedenken und Skepsis gibt, suchen wir das Gespräch, was sich als sehr hilfreich erwiesen hat, um ein gemeinsames Verständnis der sich sehr schnell verändernden Situation zu entwickeln.
Nach welchen Maßstäben / Koordinaten könnten Sie sich eine Lizensierung von Inhalten vorstellen? Orientieren Sie sich an Abkommen wie zB HarperCollins?
Wir schauen vor allem darauf, wie andere Wissenschafts- und Universitätsverlage derzeit vorgehen. Wir haben uns folgende Leitlinien für unseren Umgang mit KI und für potentielle Partnerschaften mit KI-Entwicklern gegeben:
Wir legen möglichst genau fest, welche Nutzung von Inhalten wir Technologiepartnern erlauben und welche nicht.
Wir beschränken die wortgetreue Wiedergabe von Textteilen und/oder stellen sicher, dass Technologiepartner unsere Inhalte nur zu Trainingszwecken verwenden.
Wir verlangen von Technologiepartnern eine klare Vision, wie ihre KI-Tools künftig korrekte Zitierung und nachvollziehbare Quellenangaben ermöglichen werden.
Wir stellen sicher, dass uns die Zustimmung aller Rechteinhaber*innen vorliegt, und bitten, wenn möglich, Autor*innen um ihre ausdrückliche Zustimmung.
Wir verhandeln eine faire Vergütung, für Autor*innen und den Verlag.
Wir stellen sicher, dass Inhalte nach Ablauf der Vertragslaufzeit nicht mehr genutzt werden.
Andere Verlage
Beuth, Bastei Lübbe, Carlsen, Beck, Weka, dfv Mediengruppe, Penguin Random House, Thieme oder SWMH äußern sich aktuell nicht zu dem Thema.
Die Übersicht
| Verlag | Schutz | Lizensierung an Dritte | Kommentar |
| Springer Nature | k.A. | Nein | „Wir sind immer offen für Dinge, die das Erlebnis für unsere Kunden und die breitere Forschungsgemeinschaft verbessern.“ |
| Haufe Group | k.A. | k.A. | „Noch in internen Entscheidungsprozessen“ |
| Klett Gruppe | k.A. | k.A. | Wird dezentral in den Verlagen entschieden. |
| Penguin Random House | k.A. | k.A. | Im Audio-Bereich setzt PRH selbst KI-Tools ein und hat dazu eine Kooperation mit ElevenLabs geschlossen. |
| Westermann Gruppe | Ja | Nein | |
| Wolters Kluwer | Ja | k.A. | |
| Cornelsen | Ja | Nein | Nur eigene KI-Funktionen in der Entwicklung, kein Training von KI-Lösungen von anderen Anbietern |
| C.H. Beck | k.A. | k.A. | |
| Thieme | k.A. | k.A. | |
| WEKA | k.A. | k.A. | |
| SWMH | k.A. | k.A. | |
| Wiley-VCH | k.A. | Ja | Ausgewählte Vereinbarungen; geplante Lizenzerlöse im akt. Geschäftsjahr: 44 Mio Dollar |
| VNR (Rentrop) | Ja | Nein | „Wir sehen uns auch als Anbieter von KI-Lösungen und nicht als Content-Lieferant.“ |
| dfv Mediengruppe | k.A. | k.A. | |
| Carlsen | k.A. | k.A. | |
| Vogel Communications | Ja | Nein | |
| Bastei Lübbe | k.A. | k.A. | |
| De Gruyter | Ja | Ja | Eigene KI-Angebote und Lizenzierung an andere Anbieter. |
| Beuth/DIN Media | k.A. | k.A. | |
| dtv | Ja | Nein |