392136 Indizierung von unstrukturierten digitalen Inhalten (Pj) (WiSe 2006/2007)

Short comment

Erstes von zwei Semestern.

Contents, comment

Suchmaschinen wie Google erlauben eine Indizierung von verschiedenen
digitalen Formaten im WWW. Dieser Ansatz basiert auf einer zentralen
Datenbank, d.h. es muß speziell für den Suchmaschinenbetreiber
leistungsfähige Hardware und Netzkapazität vorgehalten werden.

Eine denkbare Alternative sind Suchmaschinen wie Yacy
und Majestic-12, bei denen die Indizierungsarbeit
wie z.B. bei SETI@Home weltweit verteilt wird.
Zum Beispiel indizieren die Rechner der Benutzer
automatisch die besuchten Seiten
und bauen so einen verteilten Index über das WWW auf.

Die vorhandenen Ansätze zum Indizieren und Bewerten von Informationen sowie
zum Verhindern von Manipulationen lassen sich nicht ohne Weiteres von
zentralen Suchmaschinen auf dezentrale Systeme übertragen. Es gibt noch keine
gesamtheitlich zufriedenstellende Lösung für verteilte Suchmaschinen.

In diesem Projektseminar wollen wir bestehende Frameworks für verteilte
Suchmaschinen evaluieren. Dabei werden wir unter anderem untersuchen,
ob der Ansatz einer weltweit anonymen Nutzergruppe Ursache für die
oben beschriebenen Probleme ist und ob sich Lösungsmöglichkeiten
durch die Ausnutzung von sozialen Aspekten zwischen
Anwendergruppen finden lassen.

In diesem Rahmen wollen wir einen Prototypen entwickeln, der unsere
Ideen innerhalb eines bestehenden verteilten Suchmaschinen-Frameworks
demonstriert. Achtung: Das Projekt ist auf 2 Semester ausgelegt!

Requirements for participation, required level

  • gängige Web-Technologien (http, html/xml)
  • Programmiererfahrung OOP und Benutzeroberflächen
  • Fähigkeiten zum Hineindenken in existierenden Quellkode und

Spezifikationen im OpenSource-Bereich

Bibliography

http://www.jxta.org/
http://www.yacy.net/yacy/
http://www.majestic12.co.uk/
http://www.beagle-project.org/

External comments page

mailto:cg@techfak.uni-bielefeld.de

Teaching staff

Dates ( Calendar view )

Frequency Weekday Time Format / Place Period  

Show passed dates >>

Subject assignments

Degree programme/academic programme Validity Variant Subdivision Status Semester LP  
Naturwissenschaftliche Informatik / Diplom (Enrollment until SoSe 2004) allgem.HS   HS

No more requirements
No eLearning offering available
Limitation of the number of participants:
Limited number of participants: 6
Address:
WS2006_392136@ekvv.uni-bielefeld.de
This address can be used by teaching staff, their secretary's offices as well as the individuals in charge of course data maintenance to send emails to the course participants. IMPORTANT: All sent emails must be activated. Wait for the activation email and follow the instructions given there.
If the reference number is used for several courses in the course of the semester, use the following alternative address to reach the participants of exactly this: VST_2670352@ekvv.uni-bielefeld.de
Notes:
Additional notes on the electronic mailing lists
Last update basic details/teaching staff:
Friday, December 11, 2015 
Last update times:
Thursday, September 26, 2013 
Last update rooms:
Tuesday, June 20, 2006 
Type(s) / SWS (hours per week per semester)
project (Pj) / 4
Department
Faculty of Technology
Questions or corrections?
Questions or correction requests for this course?
Planning support
Clashing dates for this course
Links to this course
If you want to set links to this course page, please use one of the following links. Do not use the link shown in your browser!
The following link includes the course ID and is always unique:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=2670352
Send page to mobile
Click to open QR code
Scan QR code: Enlarge QR code
ID
2670352