Informationsextraktion von Webseiten via RoadRunner

German

Informationsextraktion von Webseiten via RoadRunner

Name: Informationsextraktion von Webseiten via RoadRunner
Price: 2787 INR
Availability: InStock
ISBN: 9783640518647

Pawel Broda

German

Paperback

₹2787

₹4150

32.84% OFF

(All inclusive*)

Delivery Options

Please enter pincode to check delivery time.

*COD & Shipping Charges may apply on certain items.

Review final details at checkout.

Looking to place a bulk order? SUBMIT DETAILS

Delivery Options

Please enter pincode to check delivery time.

*COD & Shipping Charges may apply on certain items.

Review final details at checkout.

LOOKING TO PLACE A BULK ORDER?CLICK HERE

About The Book

Description

Author

Forschungsarbeit aus dem Jahr 2009 im Fachbereich Didaktik - Informatik Note: 1 Ludwig-Maximilians-Universität München (Centrum für Informations- und Sprachverarbeitung) Veranstaltung: Web Data Mining Sprache: Deutsch Abstract: Das Web hat sich in den letzten Jahren zum größten existierenden und frei verfügbaren Daten- und Informationsbestand entwickelt. Im Netz wo es ein absoluter Datenüberfluss und Informationenchaos herrscht ist beinahe alles zu finden. Auf der Suche nach benötigten Informationen wird durch unzählige Dokumente gestöbert die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. Während die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert können bleibt ein sehr großer Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zurückgeführt. Die gesuchten Informationen sind nicht mehr statisch verfügbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt.In diesem riesigen Dokumentenbestand in den statischen und dynamisch generierten Webseiten werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert dass sie bequem weiterverarbeitet werden können. Im nächsten Schritt wird es versucht aus den semi-strukturierten Dokumenten relevante Informationen zu gewinnen.

Piracy-free

Assured Quality

Secure Transactions

Fast Delivery

Sustainably Printed

Details

ISBN 13

9783640518647

Publication Date

01-02-2010

Pages

Weight

49 grams

Dimensions

148x210x1.7 mm

Publisher

GRIN Verlag