Navigationsweiche Anfang

Navigationsweiche Ende

Sprache wählen


Mathematical Information Retrieval (MathIR)

 

Im Rahmen des DFG-geförderten Projektes GI 1259/1-1 

Methoden und Werkzeuge zur Verbesserung des Zugriffs auf mathematisches Wissen in Digitalen Bibliotheken für Such-, Empfehlungs- und Assistenzsysteme,

untersuchen wir grundlegende Methoden und Werkzeuge, um mathematisches Wissen für Informationssysteme zugänglich zu machen.

Um dieses Ziel zu erreichen, sind Methoden erforderlich, die mathematisches Wissen zuverlässig aus Dokumenten extrahieren. Im Forschungsgebiet Natural Language Processing (NLP) gibt es eine Reihe etablierter Methoden und Werkzeuge um domänenspezifische Informationsextraktion aus Texten durchzuführen. Ähnlich wie bei aktuellen Textverarbeitungswerkzeugen, z.B. Stanford NLP-Toolkit, wird unsere Forschung untersuchen, wie solche Werkzeuge für die Verarbeitung mathematischer Sprache realisiert werden können.

Unser Ansatz ist es, das Konzept des Mathematical Language Processing (MLP) zu erweitern, welches wir in einem Beitrag zur ACM SIGIR-Konferenz 2016 erstmals präsentiert haben (Link zum Beitrag). Im Rahmen des aktuellen Projektes erweitern wir unsere bisherigen Forschungsergebnisse, um den Ansatz effektiver und für reale Anwendungen praktikabel zu machen. Insbesondere verfolgt unser Projekt die folgenden Ziele:

  1. Identifizierung mathematischer Formeln und Ausdrücke in Dokumenten und zuverlässige Unterscheidung von ähnlichen oder benachbarten Strukturen.
  2. Durchführung einer Typerkennung und Tokenisierung von mathematischen Ausdrücken.
  3. Extraktion entsprechender mathematischer Konzepte aus den tokenisierten mathematischen Formeln und Ausdrücken.

Wir möchten anderen Wissenschaftlern die Möglichkeit geben, unsere Methoden und Werkzeuge für die Verarbeitung mathematischer Sprachen zu nutzen und eigene Probleme anzugehen. Wir hoffen, dass sich MLP während dieses Prozesses weiter verbessern wird, ähnlich wie es bei frühen NLP-Ansätzen der Fall war.

Eine Vielzahl von Anwendungen würde von Fortschritten beim Zugriff auf mathematische Informationen profitieren. In den MINT-Disziplinen könnten Verbesserungen für die Suche nach und Empfehlung von wissenschaftlicher Literatur sowie in Bezug auf die Prävention von Plagiaten erzielt werden. Darüber hinaus würde die Suche nach Experten oder Anwendungen in der reinen Mathematik, wie die Suche nach Theoremen oder Definitionen, erheblich von unseren Entwicklungen profitieren. Zu den potenziellen Anwendungen unserer Methoden außerhalb des MINT-Bereiches gehören die Verbesserung von Lehr- und Lernsystemen sowie der Patent- und Unternehmenssuche.

Zugehörige Veröffentlichungen

  

MEDIENBERICHTERSTATTUNG

 

Seit dem 9. Januar erlaubt Wikipedia die Anreicherung mathematischer Formeln mit semantischen Informationen sowie die Anzeige dieser Informationen im Live-System. Zum Beispiel werden für die...

mehr

Die Deutsche Forschungsgemeinschaft (DFG) hat unserem Lehrstuhl eine dreijährige Forschungsförderung für das Projekt Methoden und Werkzeuge zur Verbesserung des Zugriffs auf mathematisches Wissen in...

mehr

Wikipedia verwendet einen neuen Ansatz zur Darstellung mathematischer Formeln, der von unserem Teammitglied Moritz Schubotz entwickelt wurde.

Die Darstellung von Formeln als Bitmap-Bilder wurde...

mehr
zuletzt bearbeitet am: 08.12.2020