перейти к навигации

Наборы данных и их использование в PPC системах

Что это такое?

Для работы с CPA бывает полезно использовать тематические подборки структурированной информации, содержащие названия населенных пунктов, фамилии и имена известных людей, названия инфраструктурных объектов, исторических событий, выставок и т.д.  В научной среде такие выборки называются наборами данных (datasets). Я уже упоминал о наборах данных в августовской статье Спешите, дейтинг!

Зачем это нужно?

1. Такие наборы удобно использовать для создания списков ключевых слов. Если мы возьмем 1000 названий населенных пунктов и 20 модификаторов, вроде «matchmaking in», «dating in», «find partner in», то легко получим 20 тысяч ключевых слов, с весьма высокой вероятностью используемых при поиске.

2. Более сложные наборы данных пригодятся для динамически создаваемых landing страниц. Так, если набор содержит описание моделей автомобилей и изображения к ним, их размещение на странице уменьшит bounce rate и увеличит CTR для продвигаемого оффера.

Где мне их взять?

Существует достаточно много источников, собирающих информацию по какой-то конкретной тематике. В качестве примера можно привести сайты спортивных объединений, инициативных групп, всевозможные тематические рейтинги и чарты.

Есть и проекты, которые объединяют наборы данных разных тематик. Позволю себе кратко рассказать о некоторых из них.

Freebase.com

9 основных категорий, затрагивающих практически все области человеческой деятельности, достаточно большое количество данных иллюстрировано. Есть возможность скачать полный дамп (около 1.5Гб) или экспортировать интересующие данные с помощью API. Именно здесь вы легко можете найти 386,530 музыкальных исполнителей или 8,684 названий аэропортов.
На основе базы Freebase построены такие сайты как FMDB — база описаний фильмов и History of a Day — исторический календарь.

InfoChimps.org

Менее приближенные к реальности выборки, однако тоже довольно интересные для вдумчивого ислледователя. Списки шахматных игроков, названия станций метро в различных городах, виды космических телескопов, административное деление в разных странах — вы не уйдете без наборчика данных. Большая часть информации в формате YAML, к счастью, найти для него обработчик совсем не сложно. 

TheInfo.org

Этот сайт пошел по другому пути развития и представляет собой набор ссылок на уже размещенные в сети наборы данных. Здесь есть и списки самых популярных имен в США, и States, Territories, Associated Areas of the United States и даже списки самых богатых американцев, по версии журнала Forbes.

DataMob.org

Весьма симпатичный сайт, который содержит 140 наборов данных и описаний инструментов для доступа  к таким наборам. Довольно много наборов визуализировано. Проект будет не столько интересен для парсинга данных, сколько для получения свежих идей в области написания статей и поиска ключевых слов для ваших проектов. Сайт можно использовать как отправную точку для поиска тематических наборов данных, многие ссылки ведут на подробные списки источников. 

Ну, и напоследок.

Одна небольшая ссылка на набор из 166 источников datasets, которая точно закроет для вас тему их поиска, минимум до конца этого года.  

Поделитесь в комментариях наиболее интересными находками, было бы интересно узнать о вашем опыте использования наборов данных для CPA кампаний.

  • syncsync

    Если бы тут проходил конкурс пост года, я бы выбрал этот! Можно здесь упомянуть так же datapresser.com, которые не только предлагает различные базы, но и предоставляет сервис для генерации уникального контента на основе их. Регистрация там платная.

  • Ed

    Хм, а я по старинке много чего брал из wikipedia. Уж такие вещи, как список штатов и названия крупных городов, там можно найти.
    А пост действительно один из лучших.

  • creator123

    этот пост бы на 4seo в конкурс ;)
    просто отлично, без вариантов.