Курсы по парсингу

В этой записи я в основном хочу рассказать о новом курсе некого Романа Кротова, посвященном парсингу сайтов.Тема парсинга по какой-то причине меня довольно сильно цепляет. Я периодически думаю в сторону «а не создать ли мне сайт о недвижимости с обновляемым контентом», например.

И меня тут же стопорит то, что у лидеров рынка сайтостроения в этой нише — сайты на десятки и сотни тысяч страниц. Понятное дело, что такие объёмы данных вручную не создашь, их надо каким-то образом собирать и обрабатывать.

В целом для этого подходит процедура парсинга, но вот какой-то целостной картинки мира об этом способе обработки данных у меня не было.

И, в общем, прямо перед Новым 2016 годом наткнулся я на курс Романа Кротова, который так и называется «как парсить сайты». Новогодняя ночь у меня прошла под девизом: «посмотрю чуть-чуть» ))
Как он может быть полезен?Ну, например, решили вы у себя на сайте сделать подборку курсов валют — их нужно откуда-то взять. Пишете короткий код, который исполняется на вашем сайте и формирует страницу с актуальными курсами.

Если по шагам, то так:

1. Подключаетесь к чужому сайту

2. Скачиваете оттуда нужную страницу

3. Находите кусок кода, содержащий курс

4. Копируете его к себе

Повторяете несколько раз — и вуаля — у вас есть страница с этой подборкой курсов валют.

Аналогичным образом можно, например, извлекать информацию с сайтов объявлений типа авито, с социальных сетей — ВКонтакте, Фейсбук и остальное. Можно качать информацию с сайтов с недвижкой или кредитами. А если настроить запуск парсера по расписанию (например, раз в два часа), то информация будет обновляться периодически.

Через два дня сам курс я посмотрел. Ну, что я могу сказать.В этом курсе автор рассматривает три случая.

Первое — он вытаскивает информацию с игрового сайта: названия, описания, файлы игр, структуру сайта и так далее.

Второе — показывает, как работать с сайтами, которые требуют ввода имени и пароля.

Третье — рассказывает, как написать бота социальной сети на примере ВКонтакте.

Честно говоря, я сначала про бота и не заметил ничего. Но вообще, конечно, идея интересная: можно выцепить любые сообщества, любые интересы людей, собрать списки людей, интересующихся чем-то.

В общем, каков вердикт.

Плюсы курса:1. Действительно пошагово рассмотрено, как парсить сайт.

2. В результате просмотра получаешь сам парсер, который после небольшой доделки можно применять к большинству сайтов в интернете

3. В дополнительных материалах автор положил разные полезности (файлы с дополнительным кодом)

4. На самом деле начинаешь понимать, что за чем идёт: как подключаться к сайтам, как страницы качать, как на них инфу нужную искать, как её у себя разместить.

5. Это видеокурс. Есть темы, в которых нужно именно видео, а не текстовая информация.

6. Относительно короткий — можно в голове уместить с одного раза. Что-то около 2,5-3,5 часов (в зависимости от того, считать вводные уроки или нет)

7. Копеечный ценник. 2 590 руб., если быть точным. Это около 36-ти баксов на начало 2016 года. Покупать — не покупать — каждый сам решает, но покупные курсы проходишь и делаешь, потому что жалко даже небольших сумм.

Минусы тоже есть, но мелкие:1. Фоновая музычка в видео. Лучше бы её вообще не было, а то отвлекает.

2. Когда только начал смотреть, были вещи, которые автор не объяснял в начале курса. А поскольку я не программист, то воспринимать такие вещи как классы и объекты — для меня не то что сложно, а просто — я их не понимаю.

Но потом выяснилось, что это вообще никак не влияет на конечный результат: ближе к концу курса стало ясно, что и так нормально всё воспринимается.

Результат: лично я могу курс рекомендовать тем людям, которым интересна тема парсинга, которые уже посмотрели пару-тройку видео по этой теме (лично я пытался смотреть такие курсы как «Парсер контента собственными руками на PHP» (он целых 6 часов с лишним) и курс «PHP мастер» Александра Долгу»). Но, честно говоря, курс Кротова мне понравился заметно больше. Основная ценность лично для меня в том, что за какие-то три часа получаешь представление от и до о том, как организован процесс парсинга.Ссылка на продающий сайт: сайт по курсу о парсинге

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *