Informationsextraktion von Webseiten via RoadRunner
German

About The Book

Forschungsarbeit aus dem Jahr 2009 im Fachbereich Didaktik - Informatik Note: 1 Ludwig-Maximilians-Universitt Mnchen (Centrum fr Informations- und Sprachverarbeitung) Veranstaltung: Web Data Mining Sprache: Deutsch Abstract: Das Web hat sich in den letzten Jahren zum grten existierenden und frei verfgbaren Daten- und Informationsbestand entwickelt. Im Netz wo es ein absoluter Datenberfluss und Informationenchaos herrscht ist beinahe alles zu finden. Auf der Suche nach bentigten Informationen wird durch unzhlige Dokumente gestbert die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. Whrend die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert knnen bleibt ein sehr groer Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zurckgefhrt. Die gesuchten Informationen sind nicht mehr statisch verfgbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt diesem riesigen Dokumentenbestand in den statischen und dynamisch generierten Webseiten werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert dass sie bequem weiterverarbeitet werden knnen. Im nchsten Schritt wird es versucht aus den semi-strukturierten Dokumenten relevante Informationen zu gewinnen.
Piracy-free
Piracy-free
Assured Quality
Assured Quality
Secure Transactions
Secure Transactions
Delivery Options
Please enter pincode to check delivery time.
*COD & Shipping Charges may apply on certain items.
Review final details at checkout.
downArrow

Details


LOOKING TO PLACE A BULK ORDER?CLICK HERE