|
18.08.2016, 02:57
|
|
#1
|
Регистрация: 20.07.2015
Сообщений: 1,242
|
Получение кода страниц (парсинг) и работа с ним.
|
Здравствуйте!
Если вам нужно получить исходный код страниц, некоторых сайтов, форумов или блогов, вы можете использовать вот такой небольшой парсер сайтов.
Скачать его можете здесь http://replacelinks.pw/parsertags/parsertags.rar
Смотрится он вот таким образом http://replacelinks.pw/parsertags/parsertags.php
Как работать с ним?
Скачиваем файл по ссылке выше (архив). Извлекаем файлы из архива и загружаем их к себе на хостинг. Запускаем скрипт по адресу http://mysite.com/parsertags/parsertags.php
Где вместо mysite.com прописываем свой домен.
1. Получение кода страниц
Здесь мы получаем весь код всех страниц, и сохраняем в файл 1.txt
Но получить код, можно только со страниц, адрес которых заканчивается, например, на 1 2 3 или 100.
Почему так? Потому-что скрипт работает исходя из этих данных.
Например,
Начальная страница: http://mysite.com/page/1
Конечная страница: http://mysite.com/page/100
Парсер схавает код всех страниц начиная с 1-й и заканчивая 100-й (то есть всего будет 100 страниц кода в одном файле).
2. Поиск текста по тегам
Здесь, например, нам нужно с этих 100 страниц кода, выхватить только то, что нам нужно. Точнее куски кода (контент), который например начинается на и заканчивается на .
Значит, в поле
Найти текст/куски между текстов: пишем а в поле текст или куски пишем .
В итоге получим куски текстов, которые сохранятся в файле 2.txt.
3. Замена
Ну а здесь все просто,
Найти тексты: - это то, что нам нужно найти.
И заменить на: - это то, на что нужно заменить.
Не забудьте использовать кнопочку Еще, если нужно много чего разного найти и заменить одновременно.
Вот и все. Пользуйтесь.
|
|