Александр Крылов

Курсы по парсингу

/ Просмотров: 1128
В этой записи я в основном хочу рассказать о новом курсе некого Романа Кротова, посвященном парсингу сайтов.

Тема парсинга по какой-то причине меня довольно сильно цепляет. Я периодически думаю в сторону "а не создать ли мне сайт о недвижимости с обновляемым контентом", например.

И меня тут же стопорит то, что у лидеров рынка сайтостроения в этой нише - сайты на десятки и сотни тысяч страниц. Понятное дело, что такие объёмы данных вручную не создашь, их надо каким-то образом собирать и обрабатывать.

В целом для этого подходит процедура парсинга, но вот какой-то целостной картинки мира об этом способе обработки данных у меня не было.

И, в общем, прямо перед Новым 2016 годом наткнулся я на курс Романа Кротова, который так и называется "как парсить сайты". Новогодняя ночь у меня прошла под девизом: "посмотрю чуть-чуть" ))
Как он может быть полезен?

Ну, например, решили вы у себя на сайте сделать подборку курсов валют - их нужно откуда-то взять. Пишете короткий код, который исполняется на вашем сайте и формирует страницу с актуальными курсами.

Если по шагам, то так:

1. Подключаетесь к чужому сайту

2. Скачиваете оттуда нужную страницу

3. Находите кусок кода, содержащий курс

4. Копируете его к себе

Повторяете несколько раз - и вуаля - у вас есть страница с этой подборкой курсов валют.

Аналогичным образом можно, например, извлекать информацию с сайтов объявлений типа авито, с социальных сетей - ВКонтакте, Фейсбук и остальное. Можно качать информацию с сайтов с недвижкой или кредитами. А если настроить запуск парсера по расписанию (например, раз в два часа), то информация будет обновляться периодически.

Через два дня сам курс я посмотрел. Ну, что я могу сказать.

В этом курсе автор рассматривает три случая.

Первое - он вытаскивает информацию с игрового сайта: названия, описания, файлы игр, структуру сайта и так далее.

Второе - показывает, как работать с сайтами, которые требуют ввода имени и пароля.

Третье - рассказывает, как написать бота социальной сети на примере ВКонтакте.

Честно говоря, я сначала про бота и не заметил ничего. Но вообще, конечно, идея интересная: можно выцепить любые сообщества, любые интересы людей, собрать списки людей, интересующихся чем-то.

В общем, каков вердикт.

Плюсы курса:

1. Действительно пошагово рассмотрено, как парсить сайт.

2. В результате просмотра получаешь сам парсер, который после небольшой доделки можно применять к большинству сайтов в интернете

3. В дополнительных материалах автор положил разные полезности (файлы с дополнительным кодом)

4. На самом деле начинаешь понимать, что за чем идёт: как подключаться к сайтам, как страницы качать, как на них инфу нужную искать, как её у себя разместить.

5. Это видеокурс. Есть темы, в которых нужно именно видео, а не текстовая информация.

6. Относительно короткий - можно в голове уместить с одного раза. Что-то около 2,5-3,5 часов (в зависимости от того, считать вводные уроки или нет)

7. Копеечный ценник. 2 590 руб., если быть точным. Это около 36-ти баксов на начало 2016 года. Покупать - не покупать - каждый сам решает, но покупные курсы проходишь и делаешь, потому что жалко даже небольших сумм.

Минусы тоже есть, но мелкие:

1. Фоновая музычка в видео. Лучше бы её вообще не было, а то отвлекает.

2. Когда только начал смотреть, были вещи, которые автор не объяснял в начале курса. А поскольку я не программист, то воспринимать такие вещи как классы и объекты - для меня не то что сложно, а просто - я их не понимаю.

Но потом выяснилось, что это вообще никак не влияет на конечный результат: ближе к концу курса стало ясно, что и так нормально всё воспринимается.

Результат: лично я могу курс рекомендовать тем людям, которым интересна тема парсинга, которые уже посмотрели пару-тройку видео по этой теме (лично я пытался смотреть такие курсы как "Парсер контента собственными руками на PHP" (он целых 6 часов с лишним) и курс "PHP мастер" Александра Долгу"). Но, честно говоря, курс Кротова мне понравился заметно больше. Основная ценность лично для меня в том, что за какие-то три часа получаешь представление от и до о том, как организован процесс парсинга.

Ссылка на продающий сайт: сайт по курсу о парсинге

Оставьте комментарий!


Комментарий будет опубликован после проверки

     

  

MaxSiteAuth.

(обязательно)