PHP парсеры

7Assassin7

Хранитель
 
2 Янв 2014
913
1.296
36
29
imagee.pp.ua

После изучения этого видеопособия вы сформируете полную картину организации парсинга сайтов на PHP
Подробная программа курса:
Урок 1. Умный CURL
  • CURL — принципы работы
  • Создание класса обёртки
  • GET и POST запросы
  • Работа с HTTPS
  • Работа с куками
  • Эмуляция всех заголовков браузера
  • Фокусы keep alive
  • Проксирование в теории
  • Анализ заголовков
  • Следование за редиректамиь

Урок 2. Организация парсинга
  • Конфигурационные файлы для CURL
  • Нативный парсинг
  • MoveTo
  • ReadTo
  • ReadFrom
  • Другие полезные функции
  • Работа с PHPJqueryDOM
  • Объекты и их свойства
  • Селекторы и функции
  • Сохранение результатовь

Урок 3. Комбинированный парсинг
  • Проблемы PHPJqueryDOM
  • Доработка нативного класса
  • Subtag
  • Общая схема парсинга
  • Разбор этапов парсинга
  • Сохранение результатов в БД
  • Класс-обёртка для PDOь

Урок 4. Хранение скачанных данных
  • Перенос данных в БД
  • Таблица урлов: хорошее SEO + высокая скорость
  • Нереальное ускорение - замыкаем урлы в кольцо чисел
  • БД: хэш-таблица и коллизии
  • Доработка класса БД
  • Архитектурные изыски
  • Sender vs viewerь

Урок 5. Фреймворк
  • Организация PHP-классов
  • Создание js-морды
  • Две схемы: sender и viewer
  • JS для ajax-парсинга
  • JS для отображения статистики
  • Плюсы и минусы каждой схемы
  • Общая идея организации пауковь

Урок 6. Противостояние
  • Принцип работы капчи-картинки
  • Пример создания простой капчи
  • Антикапча
  • Антикапча API
  • Сохранение и передача изображения
  • Ожидание и обработка результата
  • Создание класса для антикапчиь

Урок 7. Парсинг изображений
  • Настройка парсера на bing
  • Скачивание изображений
  • Создание библиотеки для уникализации
  • Работа с изображениями в PHP
  • Освещение, обсцвечивание, сепия
  • Отражение, поворотыь

Урок 8. Подведение итогов
  • Доработка библиотеки для уникализации
  • Приёмы уникализации
  • Подведение итогов по темам
  • Теория оценки рекламы
  • Посетители * просмотры * CTR * стоимость

Автор: Дмитрий Лаврик
Продолжительность: ~14 часов

Яндекс Диск
 

Totenkopf

Работает по жести
 
14 Апр 2015
1.851
369
36
37
constantinablog.su
Ребят, по поводу курса кто что скажет? Если человек вообще не знает что такое php, то можно осилить курс? Как правило в таких делах нужен тот кто всегда подскажет почему та или иная фигня не работает.
 
  • Like
Реакции: Арамис

Арамис

Манимэйкер
 
11 Июн 2014
2.839
5.957
36
43
Ребят, по поводу курса кто что скажет? Если человек вообще не знает что такое php, то можно осилить курс? Как правило в таких делах нужен тот кто всегда подскажет почему та или иная фигня не работает.
Можно осилить что угодно - было бы желание, но одного желания мало - нужно внутри себя понять ИНТЕРЕСНО ли это тебе. Если душа к этому не лежит то даже супер мозг не поможет.................
 
  • Like
Реакции: Totenkopf и YandexBot

Арамис

Манимэйкер
 
11 Июн 2014
2.839
5.957
36
43
Я честно говоря 5.5 лет учился на юриста, а только недавно пришёл к выводу, что хочу стать программистом......почти 6 лет в пустую (И.Д.И.О.Т)
 
  • Like
Реакции: Xanders

Bazkit

Оптимизирует
 
30 Янв 2015
280
132
11
megatop.biz
Друзья мои!
Курс - супер...
Хочу просто немножко дополнить...
В simple_html_dom меняйте MAX_FILE_SIZE...
Я, блин, потратил целый день на вычисление этого...
 
  • Like
Реакции: Xanders и Арамис