Navigationsweiche Anfang

Navigationsweiche Ende

Sprache wählen


Mathematischer Informationsabruf (MathIR)

Im Rahmen des DFG-Förderprojekts GI 1259/1-1 

Methoden und Werkzeuge zur Förderung des Zugriffs auf mathematisches Wissen in Digitalen Bibliotheken für Such-, Empfehlungs- und Assistenzsysteme,

untersuchen wir grundlegende Methoden und Werkzeuge, um mathematisches Wissen für Informationsabrufwerkzeuge zugänglich zu machen.

Um dieses Ziel zu erreichen, sind Methoden erforderlich, um mathematisches Wissen zuverlässig aus Dokumenten zu extrahieren. Auf dem Gebiet der Verarbeitung natürlicher Sprache (NLP) gibt es eine Reihe gut etablierter allgemeiner Textverarbeitungsmethoden und -werkzeuge, die auf einen Text angewendet werden, um domänenspezifische Extraktionsaufgaben zu ermöglichenÄhnlich wie bei den neuesten Textverarbeitungswerkzeugen wie dem Stanford NLP-Toolkit wird in unserer Forschung ermittelt, wie ähnliche Werkzeuge zur Verarbeitung mathematischer Sprache realisiert werden können.

Unser Ansatz ist es, das Konzept der mathematischen Sprachverarbeitung (MLP) zu erweitern, für das wir bereits bei der Präsentation auf der ACM SIGIR-Konferenz im Jahr 2016 seine Machbarkeit bewiesen haben (Link zum Paper). Im Rahmen dieses Projekts erweitern wir unsere bisherigen Forschungsergebnisse, um den Ansatz effektiver und für reale Anwendungen zum Abrufen mathematischer Informationen anwendbar zu machen. Insbesondere verfolgt das Projekt die folgenden Ziele:

  1. Identifizierung mathematischer Formeln und Ausdrücke in Dokumenten und zuverlässige Unterscheidung von ähnlichen oder benachbarten Strukturen.
  2. Durchführung einer Typerkennung und Tokenisierung von mathematischen Ausdrücken..
  3. Extraktion entsprechender mathematischer Konzepte aus den tokenisierten mathematischen Formeln und Ausdrücken.

Unser Ziel ist es, anderen Wissenschaftlern die Möglichkeit zu geben, unsere Methoden und Werkzeuge für die Verarbeitung mathematischer Sprachen zu nutzen, um ihre eigenen neuartigen Probleme anzugehen. Wir hoffen, dass sich MLP während dieses Prozesses weiter verbessern wird, wie es auch bei frühen NLP-Ansätzen der Fall war.

Eine Vielzahl von Anwendungen würde von Fortschritten beim Abrufen mathematischer Informationen profitieren. In den MINT-Disziplinen könnten Verbesserungen bei der Suche nach akademischer Literatur, Literaturempfehlung und sogar der Prävention von Plagiaten vorgenommen werdenDarüber hinaus würde die Expertensuche oder Anwendungen in der reinen Mathematik, wie die Suche nach Theoremen oder die Suche nach Definitionen, erheblich von unseren Entwicklungen profitierenZu den Anwendungen außerhalb der STEM-Bereiche gehören die Verbesserung der Tools für die Nachhilfeunterstützung sowie die Patent- und Unternehmenssuche, die für Unternehmen wertvoller werden könnten, wenn sie mathematikbewusste Methoden zum Abrufen von Informationen integrieren.

Zugehörige Veröffentlichungen

  

MEDIENBERICHTERSTATTUNG

 

Seit dem 9. Januar erlaubt Wikipedia die semantische Erweiterung mathematischer Formeln mit den Definitionen der darin enthaltenen Begriffe. Zum Beispiel enthält die Formel der berühmten...

mehr

Die DFG, Deutschlands Organisation für Forschungsförderung, hat unserem Lehrstuhl ein dreijähriges Forschungsstipendium für folgendes Projekt gewährt: 

"Methoden und Anwendungen, um das Abrufen von...

mehr

Wikipedia verwendet einen neuen Ansatz zur Wiedergabe mathematischer Formeln - Stand 31. Mai. Dieser Ansatz wurde von unserem Gruppenmitglied Moritz Schubotz entwickelt.

Bitmap-Bilder, die Formeln...

mehr
zuletzt bearbeitet am: 16.11.2020