Z kursu: Podstawy nauki o danych: Eksploracja danych

Aby odblokować ten kurs, skorzystaj z bezpłatnej próbnej subskrypcji

Dołącz dzisiaj, aby uzyskać dostęp do ponad 22 800 kursów prowadzonych przez ekspertów w branży.

Wyszukiwanie tekstu w R

Wyszukiwanie tekstu w R

- [Narrator] Pierwszą rzeczą, którą musimy zrobić, to załadować kilka pakietów, których będziemy używać. Używam pacmana po prostu do zarządzania pakietami, tm to eksploracja tekstu, która da nam większość naszej funkcjonalności. SnowballC dodaje dodatkową analizę tekstu, a dplyr służy do manipulowania danymi i układania kodu za pomocą potoków, gdzie dane wyjściowe jednego polecenia są przekazywane bezpośrednio do wejścia innego. Zaczniemy od zaimportowania naszych danych. Mam wszystko w tym samym katalogu, więc nie muszę podawać konkretnej ścieżki pliku, a także tych dwóch książek, które wziąłem z projektu Gutenberg, ale już usunąłem metadane na początku i na końcu dokumentów, więc wszystko, co pozostało, to sama powieść, bez standardowego tekstu. Zaczniemy od pobrania Jane Eyre i za pomocą poleceń readLines przeczytamy ten dokument tekstowy w bookJE, dla Jane Eyre. W porządku, to jest teraz czytane, a potem zrobimy to samo dla Wichrowych Wzgórz, z wyjątkiem tego, że przejdziemy do…

Spis treści