392268 ISY Project: Information Extraction from Web Tables (Pj) (SoSe 2018)

Inhalt, Kommentar

- Short Description
The Web contains a large number (billions) of tables (e.g., HTML tables, spreadsheet documents). Many of these tables contain structured information that could be extracted and added to a knowledge base. Given such a knowledge base, important tasks such as search and question answering can be supported. To do so, the content of a table needs to be understood and represented in terms of an ontology.

In the previous year, within an <a href="https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=92380254>ISY project</a>, students developed and implemented a set of basic tasks that is a necessary prerequisite for table understanding. These basic tasks create basic hypotheses that can then be consumed by higher-level tasks. For example, given <a href="dbpedia.org">DBpedia</a> as a knowledge base and given a table cell value "Barack Obama", a task creates the hypothesis that the politician Barack Obama (which is known to DBpedia) is mentioned in that cell. Given a cell value "Aug 4, 1961" in the same table row where Barack Obama is thought to be mentioned, another task might create the hypothesis that in this cell the birthday of Barack Obama is mentioned. Higher level tasks would then generate hypotheses about rows, columns, or the entire table. Data mining an machine learning techniques will be applied to reach that goal.

The basic tasks were executed on one million Web tables, resulting in an enriched table corpus. The tasks and the results are published as a paper: <a href="https://pub.uni-bielefeld.de/publication/2913458&quot;>Towards a Large Corpus of Richly Annotated Web Tables for Knowledge Base Population</a>. The data was made available <a href="https://pub.uni-bielefeld.de/data/2912802&quot;>online</a> as well.

The task of the project is to i) develop and implement these higher level tasks by building on the basic tasks, thus to realize table understanding, ii) execute these tasks on real data, iii) extract information from tables and extend a knowledge base, and iv) evaluate the correctness of the tasks and the extracted information. Possibly, v) further basic tasks need to be implemented or existing basic tasks need to be improved.

Please note that the teams will be selected by the supervisors on the basis of short applications that students are expected to send to them. Registering to the project in the ekVV will only be regarded as expression of interest; it will not secure a team membership.
Please get in touch with the supervisors for information on the application procedure.

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

Required skills:

  • programming skills are required (e.g., Perl, Python, Java, ...). However, in a group of several students, conceptual and implementational work can be distributed among the group members.
  • knowledge of Semantic Web technologies (RDF, SPARQL) is a plus, but can be obtained during the project.
  • experiences with and knowledge about data mining and machine learning are a plus, but can be obtained during the project

Lehrende

Termine ( Kalendersicht )

Rhythmus Tag Uhrzeit Format / Ort Zeitraum  

Zeige vergangene Termine >>

Fachzuordnungen

Modul Veranstaltung Leistungen  
39-M-Inf-GP Grundlagenprojekt Intelligente Systeme Gruppenprojekt unbenotete Prüfungsleistung
Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.


Keine Konkretisierungen vorhanden
Kein Lernraum vorhanden
registrierte Anzahl: 4
Dies ist die Anzahl der Studierenden, die die Veranstaltung im Stundenplan gespeichert haben. In Klammern die Anzahl der über Gastaccounts angemeldeten Benutzer*innen.
Adresse:
SS2018_392268@ekvv.uni-bielefeld.de
Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.
Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_123314055@ekvv.uni-bielefeld.de
Reichweite:
Keine Studierenden per E-Mail erreichbar
Hinweise:
Weitere Hinweise zu den E-Mailverteilern
E-Mailarchiv
Anzahl der Archiveinträge: 0
E-Mailarchiv öffnen
Letzte Änderung Grunddaten/Lehrende:
Donnerstag, 1. Februar 2018 
Letzte Änderung Zeiten:
Donnerstag, 1. Februar 2018 
Letzte Änderung Räume:
Donnerstag, 1. Februar 2018 
Art(en) / SWS
Pj / 4
Einrichtung
Technische Fakultät
Fragen oder Korrekturen?
Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen
Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung
Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!
Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=123314055
Seite zum Handy schicken
Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code: QR-Code vergrößern
ID
123314055