Suche nach Personen

plus im Publikationsserver
plus bei Google Scholar

Bibliografische Daten exportieren
 

Explaining AI through mechanistic interpretability

DOI zum Zitieren der Version auf EPub Bayreuth: https://doi.org/10.15495/EPub_UBT_00008273
URN zum Zitieren der Version auf EPub Bayreuth: urn:nbn:de:bvb:703-epub-8273-8

Titelangaben

Kästner, Lena ; Crook, Barnaby:
Explaining AI through mechanistic interpretability.
In: European Journal for Philosophy of Science. Bd. 14 (2024) Heft 4 . - 52.
ISSN 1879-4920
DOI der Verlagsversion: https://doi.org/10.1007/s13194-024-00614-4

Volltext

[thumbnail of s13194-024-00614-4.pdf]
Format: PDF
Name: s13194-024-00614-4.pdf
Version: Veröffentlichte Version
Verfügbar mit der Lizenz Creative Commons BY 4.0: Namensnennung
Download (846kB)

Angaben zu Projekten

Projektfinanzierung: VolkswagenStiftung

Abstract

Recent work in explainable artificial intelligence (XAI) attempts to render opaque AI systems understandable through a divide-and-conquer strategy. However, this fails to illuminate how trained AI systems work as a whole. Precisely this kind of functional understanding is needed, though, to satisfy important societal desiderata such as safety. To remedy this situation, we argue, AI researchers should seek mechanistic interpretability, viz. apply coordinated discovery strategies familiar from the life sciences to uncover the functional organisation of complex AI systems. Additionally, theorists should accommodate for the unique costs and benefits of such strategies in their portrayals of XAI research.

Weitere Angaben

Publikationsform: Artikel in einer Zeitschrift
Keywords: AI; ANN; Deep learning; Discovery; Explanation; Mechanistic; interpretability; XAI
Themengebiete aus DDC: 100 Philosophie und Psychologie > 100 Philosophie
Institutionen der Universität: Fakultäten > Kulturwissenschaftliche Fakultät > Institut für Philosophie > Lehrstuhl Philosophie, Informatik und Künstliche Intelligenz > Lehrstuhl Philosophie, Informatik und Künstliche Intelligenz - Univ.-Prof. Dr. Lena Kästner
Fakultäten
Fakultäten > Kulturwissenschaftliche Fakultät
Fakultäten > Kulturwissenschaftliche Fakultät > Institut für Philosophie
Fakultäten > Kulturwissenschaftliche Fakultät > Institut für Philosophie > Lehrstuhl Philosophie, Informatik und Künstliche Intelligenz
Sprache: Deutsch
Titel an der UBT entstanden: Ja
URN: urn:nbn:de:bvb:703-epub-8273-8
Eingestellt am: 05 Mrz 2025 06:12
Letzte Änderung: 05 Mrz 2025 06:12
URI: https://epub.uni-bayreuth.de/id/eprint/8273

Downloads

Downloads pro Monat im letzten Jahr