Verlässlichkeit und Rechtssicherheit KI-generierter Inhalte durch Retrieval Augmented Generation

Technische und didaktische Rahmenbedingungen für die Lehre in den Geistes- und Sozialwissenschaften (TermRAG 4 SafeAI)

Drittmittelprojekt

Auf einen Blick

Kategorie Beschreibung
Forschungsprojekt Verlässlichkeit und Rechtssicherheit KI-generierter Inhalte durch Retrieval Augmented Generation (RAG) – Technische und didaktische Rahmenbedingungen für die Lehre in den Geistes- und Sozialwissenschaften (TermRAG 4 SafeAI) 
Leitung Prof. Dr. Karolina Suchowolec 
Fakultät Fakultät für Informations- und Kommunikationswissenschaften 
Institut Institut für Translation und Mehrsprachige Kommunikation 
Beteiligte Prof. Dr. Karolina Suchowolec, Vanessa Jochum 
Fördermittelgeber KI:edu.nrw 
Laufzeit 01.11.2024 bis 31.10.2025
 
Website
Abstract Der Einsatz generativer KI birgt neben großem Potenzial im wirtschaftlichen und öffentlichen Kontext auch zahlreiche qualitative, technische und ethische Hindernisse und Risiken, die von den Nutzer*innen, Unternehmen und öffentlichen Einrichtungen bewältigt und kritisch hinterfragt werden müssen.
Das Praxisprojekt "TermRAG 4 SafeAI" beschäftigt sich mit Retrieval Augmented Generation (RAG): Durch die Anbindung externer Wissensressourcen an die Sprachmodelle können durch diese Technik die erwähnten Hindernisse und Risiken abgefangen werden [2, 3]. Dabei konzentriert sich das Projekt besonders auf die didaktische Einbindung der Technik und die Kompetenzvermittlung, die einen erfolgreichen Einsatz mit sich bringt und entwickeln, erproben und evaluieren technische und didaktische Rahmenbedingungen, speziell in den Geistes- und Sozialwissenschaften. Dabei setzt sich das Projekt besonders mit ethischen und rechtlichen Aspekten von RAG auseinander, indem es diese in einer Lehrveranstaltung des Masterstudiengangs Terminologie und Sprachtechnologie eingehend behandelt. Durch den Einsatz kleinerer Sprachmodelle (SLMs) wird außerdem auch die ökologische Perspektive mitberücksichtigt.
Ziel des Projekts ist es, eine technische Umgebung bereitzustellen, die flexibles Arbeiten für die Studierenden ermöglicht und Modellcharakter für weitere Hochschulen haben kann. Eine Wissensressource wird für die RAG-Pipeline in Form einer Terminologiedatenbank geschaffen. Die didaktische Konzeption und Durchführung der Veranstaltung wird während des Semesters kontinuierlich kritisch reflektiert und evaluiert, um Handlungsempfehlungen zur Nutzung von RAG in der Lehre, besonders in den Geistes- und Sozialwissenschaften, zu entwickeln. Diese Ergebnisse und die daraus abgeleitete didaktische Handreichung sollen anderen Hochschulen zur Verfügung gestellt werden, um den kompetenten Einsatz von RAG zu fördern.
Dieses praxisorientierte Projekt trägt dazu bei, zukunftsweisende Ansätze zur Optimierung KI-generierter Inhalte in der universitären Bildung zu implementieren sowie die Kompetenz, neue KI-Technologien kritisch zu beleuchten, zu vermitteln.
 
Literatur [1] Bender, E. M.; T. Gebru, A. McMillan-Major, S. Shmitchell (2021): "On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?" Conference on Fairness, Accountability, and Transparency (FAccT ’21), Virtual Event, Canada. ACM, New York, NY, USA, March 3–10, 2021, 610-623. https://doi.org/10.1145/3442188.3445922

[2] Shuster, K.; S. Pob, M. Chen, D. Kiela, J. Weston (2021): "Retrieval Augmentation Reduces Hallucination in Conversation." M.F. Moens, X. Huang, L. Specia, S. Wen-tau Yih (Hg.): Findings of the Association for Computational Linguistics: EMNLP 2021. Punta Cana: Association for Computational Linguistics, 3784-3803

[3] Lang, C; R. Schneider, N. D. T. Tu (2024): "Automatic Question Answering for the Linguistic Domain – An Evaluation of LLM Knowledge Base Extension with RAG". A. Rapp, L. Di Caro, F. Meziane, V. Sugumaran (Hg.): Natural Language Processing and Information Systems. 29th International Conference on Applications of Natural Language to Information Systems, NLDB 2024, Turin, ltaly, June 25- 27, 2024, Proceedings, Part II. Cham: Springer, 161-171
 
Fachliche Anbindung Terminologiewissenschaft, Sprachtechnologie, Small Language Models, Retrieval Augmented Generation, Geistes- und Sozialwissenschaften 
M
M