Back to Question Center
0

Підручник з Chrome Web Scraper від Semal Expert

1 answers:

Якщо ви використовуєте Google Chrome, у вашому браузері є розширення які можуть допомогти очистити веб-сторінки. Він відомий як "Scrapper", і його можна використовувати без проблем. Скраппер допоможе очистити вміст веб-сайту та завантажувати його в документи Google.

Як залишити веб-сайт за допомогою розширення Scraper?

1. Виберіть Веб-магазин Chrome в Google Chrome;

2. У розширеннях виконайте пошук «Скраппер»;

3. Першим результатом пошуку є розширення, відоме як "Scrapper";

4. Виберіть кнопку "Додати до Chrome";

5. Повернутися до списків депутатів Великої Британії;

6. Клацніть наступне посилання ;

7. Тепер шукайте один MP і переконайтесь, що запис позначений;

8. Клацніть правою кнопкою миші, щоб вибрати "Скребок" Подібна ... "опція;

9. Консоль для скребків з'явиться в іншому вікні;

10. Перегляньте скребковий вміст у скребку консоль;

11. Щоб забезпечити збереження вмісту в електронній таблиці Google, виберіть "Зберегти в Документах Google ..."

Розширена очищення

Перш ніж дотримуватися цього рецепта , корисно зрозуміти основи HTML.Наприклад, ви можете прочитати коротке введення в HTML за цим посиланням

Давайте уявити, що ми зацікавлені у всіх фільмах, які зіграли Азію Аргенто, знаменита італійська актриса.

1. Існує дуже детальний архів акторів у IMDB. Азія Argento сайт: https://www.imdb.com/name/nm0000782/;

2 Тут ви можете переглянути всі ролі, які грає актриса..Почнемо брати інформацію, яка нас цікавить;

3. Спробуйте скоблити його так, як було описано вище;

4. Ви побачите, що список трохи спотворений. Це пов'язано з тим, що список тут може бути структурований по-різному;

5. Відведіть на консоль для скребків. Вгорі ліворуч, ви побачите невелику коробку, яка говорить XPath;

6. Xpath - це свого роду мова запиту, яка працює для XML та HTML;

7. XPath може допомогти знайти частину сторінки, на яку вас цікавить. Наступним є пошук відповідного елемента та написання XPath для нього;

8. Тепер влаштуємо наш стіл;

9. Ви побачите, що наш існуючий XPath, у якому є всі необхідні дані, є "// div [3] / div [3] / div [2] / div";

10. XPath повідомляє систему, щоб переглянути HTML-документ і вибрати третій елемент, а потім другий елемент, а потім всі вони;

11. Але ми хочемо, щоб наші дані були виділені;

12. Використовуйте розділ стовпців у консолі для скребків, щоб це зробити;

13. Давайте спочатку знайдемо наш титул РІР "Використовуйте Inspect Element для перегляду заголовка;

14. Перевірте заголовок у тезі. Додайте тег до XPath;

15. Вираз, як видається, функціонує належним чином, тому зробимо його нашим першим стовпцем;

16. У розділі "Стовпці" замінити назву першого стовпця на "заголовок";

17. Додайте до неї XPath;

18. У розділі стовпців XPath відносні, а це означає, що "./b" вибере елемент

19. У XPath для стовпчика заголовка додайте "./b" і виберіть "scrape";

20. Тепер давайте продовжувати йти протягом року. Роки можна зустріти протягом одного проміжку;

21. Створіть новий стовпець, вибравши невеликий плюс біля стовпця для свого заголовку;

22. За допомогою XPath "./span" створіть стовпець для "year";

23. Натисніть на скребок і подивіться, як додано рік;

24. Готово!

1 week ago
Підручник з Chrome Web Scraper від Semal Expert
Reply