Menu

Ekstrakcja danych z językiem Python. Pozyskiwanie danych z internetu. Wydanie II - Ryan Mitchell (opr. broszurowa)

Cechy produktu

  • ISBN 9788328356351 
  • Oprawa broszurowa 
  • Autor Mitchell Ryan 
  • Wydawnictwo Helion 
  • Ilość stron 272 
  • Rok wydania 2019 

Opis

Ekstrakcję danych (ang. Web scraping), zwaną również wydobywaniem danych z zasobów internetu, dużo osób postrzega jako wyższy stopień wtajemniczenia: przy niewielkim wysiłku można uzyskać imponujące wyniki i zastosować je w różnoraki sposób. Nie dziwi więc, że wokół tej dziedziny narosło niemało mitów. Wątpliwości jest dużo, począwszy od legalności tego typu praktyk, skończywszy na właściwościach rozmaitych narzędzi. W praktyce na ekstrakcję danych składa się cały szereg różnych technik i technice, takich jak analiza danych, analiza składniowa języka naturalnego, a także zabezpieczenie danych. Aby w pełni zastosować ich zalety, niezbędne jest zrozumienie sposobu, w jaki funkcjonują.

Ta książka jest nieprzeciętnym przewodnikiem po technikach pozyskiwania danych z internetu. Przedstawiono tu również zasady gromadzenia, przekształcania i stosowania danych z różnych zasobów. W kontekście ekstrakcji danych omówiono zagadnienia związane z bazami danych, serwerami sieciowymi, protokołem HTTP, językiem HTML, bezpieczeństwem sieciowym, przetwarzaniem obrazów, analizą danych i wieloma innymi kwestiami. Zaprezentowane tu rozwiązania programistyczne zostały napisane w Pythonie. Nie zabrakło też omówienia bibliotek {pomocn|przydatn)ych w pracy osób tworzących roboty indeksujące. Dzięki tej książce szybko zaczniesz pozyskiwać i w dowolny sposób wykorzystywać posiadane dane. Już dziś te rozwiązania są stosowane w prognozowaniu rynkowym, tłumaczeniu maszynowym, a nawet w diagnostyce medycznej!

Najważniejsze zagadnienia:

korzystanie z platformy Scrapy do tworzenia robotów
metody odczytu, wydobywania i przechowywania pozyskiwanych danych
oczyszczanie i normalizacja danych
interfejsy API
przetwarzanie obrazów na tekst
testowanie witryn za pomocą robotów
Wyszukuj dane, gromadź je i korzystaj z nich do woli!
O autorze
Ryan Mitchell - jest starszą inżynier oprogramowania w firmie HedgeServ (Boston), gdzie zajmuje się tworzeniem interfejsu API przedsiębiorstwa i narzędzi do analizy danych. Ukończyła uczelnię Olin College of Engineering, a także Harvard University Extension School z tytułem magistra inżynierii oprogramowania oraz certyfikat studiów podyplomowych na kierunku analiza danych. Przed dołączeniem do firmy HedgeServ zajmowała się pisaniem robotów indeksujących i narzędzi automatyzacji w przedsiębiorstwie Abine. Zajmuje się również doradztwem na temat ekstrakcji danych w branży detalicznej, finansowej i farmaceutycznej, ponadto była konsultantką ds. Programu nauczania i wykładowczynią kontraktową na Uniwersytecie Północnozachodnim i uczelni Olin College of Engineering.

Opinie - 0 opinii

+ Dodaj opinie

Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką prywatności. Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce.