Контент мы будем добывать с youtube.com, а именно, это субтитры, которые не индексируются поисковыми системами, сам youtube.com автоматически их создает при добавлении любого видео на сайт. Такого контента там очень много и найти 50-100к текста не займет более 10-и минут, сейчас вы сами в этом убедитесь. Также, помимо этого вы сами можете скачивать видео без субтитров и заново загружать их на ютуб. И вуаля, у вас будут нужные субтитры в считанные секунды. И вообще сама идея состоит в распознавании речи всякого обучающего и информационного видео или аудио, также можно распознавать различные тренинги и аудио-курсы, после этого нужно править текст руками.
Как это можно использовать рерайтерам описано в конце мануала.
Начало работы:
1. Переходим на youtube.com и вбиваем в поиск интересующую нас тематику(для примера я взял авто). Также, для того, чтобы искать сразу больше текста, настраиваем фильтр, чтобы показывало видео, которые идут >20 минут.
2. Открываем все видео подряд и смотрим, где будет значок субтитров, он обведен на рисунке ниже.
У нас это оказалось видео на первой странице:
3. Далее мы нажимаем на кнопку субтитров и проверяем их на уникальность.
Адвего показал нам, что она составляет целых 100%, что не может нас не радовать.
Вот собственно и вся методика по добыче. Также хочется дать несколько советов:
1.Подбирайте качественные информационные запросы, если интересует автомобильная тематика, то можно его сформировать как советы «автовладельцам» или «выбираем авто» , по ссылке видео по этому запросу.
Вот примеры видео с титрами, которые я нашел по запросы «выбираем авто»:
http://www.youtube.com/watch?v=_W2tTBQTmGs
http://www.youtube.com/watch?v=YrYZXekrjWg
http://www.youtube.com/watch?v=zMkQ-9nODB0
http://www.youtube.com/watch?v=sUmsJvOsmb0
http://www.youtube.com/watch?v=3MFQmzH3mAs
http://www.youtube.com/watch?v=oNtOUih3s9o
2. Фильтруйте короткие видео, т.к в них мало текста.
Обработка контента
Контент можно использовать и в готовом виде, но лучше его еще немного обработать таким софтом какDecorator и Afterscan, данные программы помогут придать им человеческий вид.
Кратко о обработке: удалить все цифры, добавить пробелы после знаков препинания и удалить лишние, в конце всех строк добавить точки и сделать чтобы все предложения начинались с заглавной буквы , в программе Afterscan автоматически заменить плохо-распознанные слова на человеческие ну и мелкие правки руками.
Также всю эту работу можно поручить школьникам, создав тему на фрилансе или школофорумах типомегасофта.
Райтерам
Рерайтеры могут использовать данную тему очень просто: забивать нужную вам тему, искать видео с субтитрами и править руками все субтитры, чтобы получился человеческий текст. Обычно очень много править не приходится и вы можете сократить время на написание статьи в несколько раз.
Как это можно использовать рерайтерам описано в конце мануала.
Начало работы:
1. Переходим на youtube.com и вбиваем в поиск интересующую нас тематику(для примера я взял авто). Также, для того, чтобы искать сразу больше текста, настраиваем фильтр, чтобы показывало видео, которые идут >20 минут.
2. Открываем все видео подряд и смотрим, где будет значок субтитров, он обведен на рисунке ниже.
У нас это оказалось видео на первой странице:
3. Далее мы нажимаем на кнопку субтитров и проверяем их на уникальность.
Адвего показал нам, что она составляет целых 100%, что не может нас не радовать.
Вот собственно и вся методика по добыче. Также хочется дать несколько советов:
1.Подбирайте качественные информационные запросы, если интересует автомобильная тематика, то можно его сформировать как советы «автовладельцам» или «выбираем авто» , по ссылке видео по этому запросу.
Вот примеры видео с титрами, которые я нашел по запросы «выбираем авто»:
http://www.youtube.com/watch?v=_W2tTBQTmGs
http://www.youtube.com/watch?v=YrYZXekrjWg
http://www.youtube.com/watch?v=zMkQ-9nODB0
http://www.youtube.com/watch?v=sUmsJvOsmb0
http://www.youtube.com/watch?v=3MFQmzH3mAs
http://www.youtube.com/watch?v=oNtOUih3s9o
2. Фильтруйте короткие видео, т.к в них мало текста.
Обработка контента
Контент можно использовать и в готовом виде, но лучше его еще немного обработать таким софтом какDecorator и Afterscan, данные программы помогут придать им человеческий вид.
Кратко о обработке: удалить все цифры, добавить пробелы после знаков препинания и удалить лишние, в конце всех строк добавить точки и сделать чтобы все предложения начинались с заглавной буквы , в программе Afterscan автоматически заменить плохо-распознанные слова на человеческие ну и мелкие правки руками.
Также всю эту работу можно поручить школьникам, создав тему на фрилансе или школофорумах типомегасофта.
Райтерам
Рерайтеры могут использовать данную тему очень просто: забивать нужную вам тему, искать видео с субтитрами и править руками все субтитры, чтобы получился человеческий текст. Обычно очень много править не приходится и вы можете сократить время на написание статьи в несколько раз.