Ответ
Инструменты поиска субъектов на веб-странице Опции темы
Старый 01.07.2014, 22:26
  #1
Bubble
 
Регистрация: 14.02.2014
Сообщений: 17

Инструменты поиска субъектов на веб-странице
Поисковые системы используют в качестве рычагов структурированные данные, чтобы определить, какие объекты находятся на веб-странице. Они также могут делать это с помощью других методов, таких как обработка естественного языка и машинное обучение.

В этой статье мы познакомимся с различными инструментами, которые помогут вам выявить включения на веб-страницах. Эти инструменты включают в себя:
  • Интересные / Chrome модули / расширения, которые позволяют увидеть объекты, полученные из структурированных данных / разметки, когда вы серфите любую веб-страницу
  • Фантастический инструмент визуализации графиков, что может быть запущен на локальном компьютере
  • Инструменты, которые извлекают включения веб-страницы с помощью обработки методом естественного языка.






Полезные Chrome модули / расширения

Есть несколько Chrome плагинов, которые являются чрезвычайно полезными в понимании структурирования данных веб-страницы. Ниже показаны расширения Chrome, которые я использую, чтобы найти ключевые слова с помощью поиска Chrome Web Store.





Вот ссылки на каждое расширение:

В использования этих плагинов есть много преимуществ. Они действительно дают хорошее понимание разметки сайтов, которые вы находите ежедневно в Интернете. Когда вы видите эти маленькие микроданные и структурированные иконки разметки в своем браузере, вам нужно всего лишь нажать на них, чтобы сразу увидеть, какие виды разметки и метаданных находятся на странице.

Еще одним преимуществом является то, что некоторые из этих расширений сканируют JavaScript, так что вы можете увидеть все виды интересной информации, которые вы не могли видеть, запустив те же страницы через инструмент тестирования Google rich snippets.

Попытка отобразить весь объем информации, предоставляемой всеми этими расширениями в одном скриншоте не является возможной, поэтому я решил включить лишь несколько примеров, с разбивкой на несколько скриншотов.

Тот факт, что существует слишком много информации для отображения ее на одном скриншоте, свидетельствует о росте структурированных данных в Интернете. По сравнению с 2012 г., ее число возросло на несколько порядков.

Скриншотами ниже получите представление об основных видах информации, которую можно получить с помощью расширенных микроданных. В то время как эта информация очень похожа во всех 3 расширениях, очень хорошо, что есть несколько инструментов, когда один инструмент поднимает ту информацию, которую пропустили остальные.











Все три плагина определили разметку schema.org, в том числе свойства для изображений, имя, бренд, производителя, модель, код продукта, предложение и описание. Они также определили наличие на странице разметки для обзоров и рейтинга.

Маркетологи, которые хотят реализовать свою собственную структурированную разметку могут быть наиболее заинтересованы в расширении сниффера Microdata/JSON-LD (средний скриншот выше), так как он предоставляет информацию в удобном HTML виде.

Инспектор META SEO дает представление более высокого уровня:





Как видно на скриншоте выше, инспектор META SEO позволяет увидеть все виды метаданных, предусмотренные для поисковых систем, начиная от старомодных тегов, до метаданных для schema.org, Facebook Open Graph, Twitter tools/cards и многое другое.

Последнее расширение, которое я планирую раскрыть это Green Turtle RDFa. Это расширение предоставляет не только полный перечень предикат-объектов информации на веб-странице, но и визуализацию всей этой информации. Вот такую информацию Green Turtle черпает на странице продукта Walmart, которым мы воспользовались в качестве примера:





При включении правильных настроек, этот инструмент также извлекает микроданные. Чтобы включить такую функцию этого расширения, необходимо выполнить следующие действия:

Как только вы загрузили расширение Green Turtle в свой Chrome браузер, перейдите в меню Сервис -> Расширения и найти его в списке расширений. Выберите "Настройки", затем установите флажок Включать микроданные.





Теперь, после включения RDF и разбора микроданных, вы будете в состоянии видеть больше информации. Проверьте новые результаты для той же страницы продукта Walmart:





Инструмент структурированной визуализации данных: Gruff

Gruff является бесплатным инструментом, который можно свободно скачать как под Mac, так и под PC, и который позволяет визуализировать полученные структурированные данные.





Для использования Gruff, необходимо сначала скачать его. Чтобы запустить его локально и использовать более простую установку, я бы рекомендовал брать версию 3.3.

После установки Gruff, вам нужно будет создать " New Triple-Store " в меню File. После завершения, вы можете извлекать данные веб-страницы, зайдя в File –> Extract Microformat/RDFa Data from Web Page, а затем введя URL в поле. (Оставьте поле Graph Name пустым).





Когда программа закончит извлечение данных, перейдите на вкладку Display и выберите последний вариант, Display Triples of One Graph. Это должно поднять карту визуализации данных (как показано выше).

Инструменты, которые позволяют получить информацию из текста

TextRazor
является API, который анализирует ввод текста, чтобы определить информацию о конкретных включениях в рамках этого текста. С помощью этого инструмента, вы можете "извлечь кто, что, зачем и как" из текста веб-страницы, заметки в социальной сети, электронной почты и т.д. Чтобы увидеть, как это работает, проверьте их демонстрационную страницу и введите текст.

В качестве примера, вот что TextRazor определил при анализе моего текста:








Другие полезные инструменты и API-интерфейсы для добычи сущности из текста включают в себя:


С этими инструментами может быть интересно поиграть, обеспечивая при этом полезное понимание того, что объекты и сущности могут быть получены как из структурированных, так и с неструктурированных источников информации.

Основные тезисы
  • Понимание того, что объекты могут быть получены из структурированной, частично структурированной, а также неструктурированной информации на странице, может быть чрезвычайно полезным при переходе в понимание семантического поиска.
  • Потратьте некоторое время, просто играя с этими инструментами, и вы увидите, что задача и концепция являются менее сложными, чем кажется.
  • Если окажется сложно, то это потому, что это сложно! Тем не менее, это просто полезно и весело.
Нравится 0   Не нравится 0
Пожаловаться на это сообщение 0  
Ответить с цитированием

Ответ
 
 

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
12 инструментов поиска изображений для блога Green Сервисы 0 11.06.2014 13:01
Инструменты для создания дружеского UX/UI Viper Сервисы 0 11.05.2014 01:39
Инструменты для увеличения уровня конверсии StrannikK Аналитика 2 28.06.2013 17:34
Как Google разрушает доверие к результатам поиска 0pium Статьи 4 20.04.2013 20:03
Основные инструменты видеомаркетинга Alsu Магазины 0 27.03.2013 21:51

Метки
контент, метаданные, объекты, структура информации


Здесь присутствуют: 1 (пользователей: 0, гостей: 1)
 
Опции темы

Быстрый переход


Текущее время: 23:09. Часовой пояс GMT +3.