Verlässlichkeit und Rechtssicherheit KI-generierter Inhalte durch Retrieval Augmented Generation
Technische und didaktische Rahmenbedingungen für die Lehre in den Geistes- und Sozialwissenschaften (TermRAG 4 SafeAI)
Drittmittelprojekt
Auf einen Blick
Kategorie | Beschreibung |
---|---|
Forschungsprojekt | Verlässlichkeit und Rechtssicherheit KI-generierter Inhalte durch Retrieval Augmented Generation (RAG) – Technische und didaktische Rahmenbedingungen für die Lehre in den Geistes- und Sozialwissenschaften (TermRAG 4 SafeAI) |
Leitung | Prof. Dr. Karolina Suchowolec |
Fakultät | Fakultät für Informations- und Kommunikationswissenschaften |
Institut | Institut für Translation und Mehrsprachige Kommunikation |
Beteiligte | Prof. Dr. Karolina Suchowolec, Vanessa Jochum |
Fördermittelgeber | KI:edu.nrw |
Laufzeit |
01.11.2024 bis 31.10.2025 |
Website | |
Abstract |
Der Einsatz generativer KI birgt neben großem Potenzial im wirtschaftlichen und öffentlichen Kontext auch zahlreiche qualitative, technische und ethische Hindernisse und Risiken, die von den Nutzer*innen, Unternehmen und öffentlichen Einrichtungen bewältigt und kritisch hinterfragt werden müssen. Das Praxisprojekt "TermRAG 4 SafeAI" beschäftigt sich mit Retrieval Augmented Generation (RAG): Durch die Anbindung externer Wissensressourcen an die Sprachmodelle können durch diese Technik die erwähnten Hindernisse und Risiken abgefangen werden [2, 3]. Dabei konzentriert sich das Projekt besonders auf die didaktische Einbindung der Technik und die Kompetenzvermittlung, die einen erfolgreichen Einsatz mit sich bringt und entwickeln, erproben und evaluieren technische und didaktische Rahmenbedingungen, speziell in den Geistes- und Sozialwissenschaften. Dabei setzt sich das Projekt besonders mit ethischen und rechtlichen Aspekten von RAG auseinander, indem es diese in einer Lehrveranstaltung des Masterstudiengangs Terminologie und Sprachtechnologie eingehend behandelt. Durch den Einsatz kleinerer Sprachmodelle (SLMs) wird außerdem auch die ökologische Perspektive mitberücksichtigt. Ziel des Projekts ist es, eine technische Umgebung bereitzustellen, die flexibles Arbeiten für die Studierenden ermöglicht und Modellcharakter für weitere Hochschulen haben kann. Eine Wissensressource wird für die RAG-Pipeline in Form einer Terminologiedatenbank geschaffen. Die didaktische Konzeption und Durchführung der Veranstaltung wird während des Semesters kontinuierlich kritisch reflektiert und evaluiert, um Handlungsempfehlungen zur Nutzung von RAG in der Lehre, besonders in den Geistes- und Sozialwissenschaften, zu entwickeln. Diese Ergebnisse und die daraus abgeleitete didaktische Handreichung sollen anderen Hochschulen zur Verfügung gestellt werden, um den kompetenten Einsatz von RAG zu fördern. Dieses praxisorientierte Projekt trägt dazu bei, zukunftsweisende Ansätze zur Optimierung KI-generierter Inhalte in der universitären Bildung zu implementieren sowie die Kompetenz, neue KI-Technologien kritisch zu beleuchten, zu vermitteln. |
Literatur |
[1] Bender, E. M.; T. Gebru, A. McMillan-Major, S. Shmitchell (2021): "On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?" Conference on Fairness, Accountability, and Transparency (FAccT ’21), Virtual Event, Canada. ACM, New York, NY, USA, March 3–10, 2021, 610-623. https://doi.org/10.1145/3442188.3445922 [2] Shuster, K.; S. Pob, M. Chen, D. Kiela, J. Weston (2021): "Retrieval Augmentation Reduces Hallucination in Conversation." M.F. Moens, X. Huang, L. Specia, S. Wen-tau Yih (Hg.): Findings of the Association for Computational Linguistics: EMNLP 2021. Punta Cana: Association for Computational Linguistics, 3784-3803 [3] Lang, C; R. Schneider, N. D. T. Tu (2024): "Automatic Question Answering for the Linguistic Domain – An Evaluation of LLM Knowledge Base Extension with RAG". A. Rapp, L. Di Caro, F. Meziane, V. Sugumaran (Hg.): Natural Language Processing and Information Systems. 29th International Conference on Applications of Natural Language to Information Systems, NLDB 2024, Turin, ltaly, June 25- 27, 2024, Proceedings, Part II. Cham: Springer, 161-171 |
Fachliche Anbindung | Terminologiewissenschaft, Sprachtechnologie, Small Language Models, Retrieval Augmented Generation, Geistes- und Sozialwissenschaften |