вторник, 1 июля 2014 г.

Scraping! WTF?!

Когда примерно год назад на Leanpub начали активно появляться новые главы книжки английского журналиста и исследователя медиа Paul Bradshow "Scraping for Journalists", Google, да и "Яндекс", впрочем, не выдавали ни одного релевантного результата на русском языке по запросу "скрэпинг". Ничего с этим словом не было и в тематической периодике - по крайней мере, в той, что есть в открытом доступе.

Между тем, скрэпинг - это автоматизированные, чаще всего на основе программирования, сбор информации по оцифрованным массивам данным и последующая ее, также автоматизированная, обработка.

Вспомнил я о "скрэпинге" в связи с недавними мастер-классами московских журналистов, прошедшими в УрФУ. В частности, в связи c выступлением аналитика Rambler Филлипа Каца. 

В анонсе своего выступления он обещал пошагово и на конкретных примерах показать, как использовать сервисы для скрэпинга при сборе информации для инфографики. На время его рассказа в аудитории установилась почти кристальная тишина. Конечно, повторять следом за ним и в его темпе, похоже, никто не решился, но и вопросов по соответствующим алгоритмам и сервисам у аудитории почти не было. Сдается мне, что "скрэпинг" до сих пор остается тем ремеслом, которое пока что находится за некими психологическими границами технических навыков, которые считают необходимыми для себя журналисты и близкие им специалисты. 

Между тем, Филипп порекомендовал несколько сервисов для скрэпинга, которые позволяют по возможности обойтись без программирования в поиске и сборе необходимых данных:
  • плагин Scraper для Chrome
  • плагин и веб-сервис Kimono 
  • сервис Google Refine
  • тематический ресурс Scraperwiki
Конечно, навыки скрэпинга можно развить, наверное, таким же образом, как и умение играть на музыкальном инструменте - только при постоянной практике. Но он сегодня востребован как никогда. И не только в журналистике. Коммерческие структуры, например, также заинтересованы в автоматизированных системах сбора данных - например, для формирования клиентских баз на основе открытой информации в Интернете, либо для анализа упоминаний бренда и т.д. Так что, скорее всего, в следующем учебном году и мы будем вынуждены ввести новое задание по "Современным информационным технологиям" - по использованию того или иного инструмента скрэпинга. 

четверг, 29 мая 2014 г.

Прием заданий закончен!


Час X наступил - прием заданий у населения закончен в 22:00. В таблице - окончательные результаты на текущий момент. Кто не нашел свою фамилию или необходимое количество отметок "выполнено" напротив нее, завтра зачет не получит. Но написать тест будет можно - только зачет вы сможете получить только после выполнения всех заданий. Проверять их завтра непосредственно во время теста я не буду. Оправдания - не дошла ссылка или "ой, не туда выслал (а)", не принимаются - на отслеживание, куда и когда она ушла, у вас был целый семестр. Не нужно было делать это в последние дни перед зачетом. Успехов!

Напоминаю - у кого есть возможность, возьмите завтра с собой смартфоны или планшеты с мобильным интернетом для выполнения теста в электронном варианте. 

среда, 28 мая 2014 г.

Тест по "Современным информационным технологиям"

Внимание! В пятницу будет возможность написать тест в электронном варианте - в таком режиме работа проверяется автоматически и практически мгновенно, что, безусловно, упрощает весь процесс сдачи. Для этого при возможности возьмите с собой планшет или смартфон с мобильным интернетом.

Если вы по тем или иным причинам не сможете написать тест в электронном формате, безусловно, можно будет сдать его в те же день и время и традиционно - на бумаге.

Время написания теста решено сократить до 25 минут. Как показывает практика, это тот самый средний показатель, в который укладывается большинство студентов. При этом количество вопросов осталось прежним - те же 25. Т.е. по минуте на каждый вопрос.

Не забудьте выслать мне ваше сетевое творчество, которое было допуском к сдаче зачета. В противном случае вы не сможете получить удовлетворительную оценку в пятницу.

четверг, 15 мая 2014 г.

Анализ интернет-СМИ. Дополнительное задание по "Конвергентной журналистике"

Анализ интернет-СМИ

Внимание! Данное задание не является обязательным. Оно создано для особых случаев "большого интереса к предмету". 

Задание:

  1. Выбрать для анализа одно из существующих интернет-СМИ. Желательно крупное - так будет лечге делать работу.
  2. Описать историю развития данного интернет-СМИ в контексте появления новых рубрик, разделов, тем, функций на его сайте. Помочь в реконструкции прошлого образа может специальный сервис - web.archive.org.
  3. Описать структуру сайта интернет-СМИ и особенности подачи информации в каждом из разделов.
  4. Описать особенности рубрикации материалов сайта интернет-СМИ - используется ли система тэгов либо применяется какой иной способ.
  5. Есть ли на сайте раздел блогов журналистов? Если да, то отличается ли подача информации в нем от традиционной? И в чем состоят эти отличия?
  6. Можно ли назвать данное СМИ конвергентным? Использует ли оно возможности разных типов мультимедиа контента? Определить место в типологии интернет-СМИ с опорой на литературу по теме.
  7. Выявить особенности распространения контента данного СМИ - есть ли платная подписка, есть ли версии для мобильных телефонов и портативных компьютеров - в чем заключается их отличие от "большой" версии сайта, есть ли доступ к архивным материалам и на каких условиях?
  8. Выявить дополнительные способы получения дохода данным СМИ - продажа контента, разного рода сервисы и проч.
  9. Выявить пути использования данным интернет-СМИ пользовательского контента - через комментарии, форумы, формы для отправки видео и фото материалов и т.д.

Свою работу вы размещаете в созданном вами в ходе выполнения задания по предмету "Конвергентная журналистика" блоге основе blogger.com . Задание удобно размещать не в виде очередного сообщения блога, но в формате "страницы".

Если вы не выполняли задание по "Конвергентной журналистике" либо забыли пароли-явки от панели управления созданного блога, сделайте блог заново. В случае возникновения технических проблем, воспользуйтесь встроенной справкой, которая есть на выбранном вами блог-хостинге.

Кроме описанных выше платформ можно обратиться к недавно появившимся, но уже завоевавшим определенную популярность - tumblr.com & posterous.com.

Ссылки на выполненные работы буду рад видеть в комментариях к этому заданию.

Копипаст в текстах работ будет основанием для их возвращения на переделку. Если вы используете фрагменты текста с тех или иных сетевых ресурсов, применяйте правила цитирования источников.

понедельник, 28 апреля 2014 г.

Новые инструменты для журналистов

Целая пачка технологических инструментов для работы мультимедийных журналистов, конвергентных редакций - в подборке от ijnet.org. Весьма рекомендуется для исследования и изучения. Доступны по ссылке. 


К недавнему закону об ответственности блогеров


Высказывался на этот счет на пресс-конференции "Интерфакс-Урал". Вот, один из материалов, написанных по мотивам той пресс-конференции, от информагентства "Политсовет".