Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Тематические » Системы управления сайтами » Грабление страниц

Модерирует : Antuan

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

vpol



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть такая задача...
Есть портал на Нюке... Есть другие сайты на подобную тематику в Инете.
Как можно простыми средствами сграбить эти страницы полностью или их фрагменты с автоматическим вкраплением их в новостной блок Нюки или в блок сообщений, на худой конец в Контент? Есть ли для этого средства в самой Нюке? Если есть, то поподробнее технологию хотелось бы узнать...
Кто-нибудь делал это?
Готовые скрипты есть для этого?

Всего записей: 858 | Зарегистр. 12-08-2001 | Отправлено: 23:28 20-03-2002
Tavik



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Есть ли для этого средства в самой Нюке? Если есть, то поподробнее технологию хотелось бы узнать...  

Таких средств (чтобы грабить все подряд) - нету.
Есть только брать заголовки с сайтов...... и то построенных на нюке и специально настроенных.


----------
http://www.HUB.ru - Все о Домашних Сетях России

Всего записей: 633 | Зарегистр. 23-01-2002 | Отправлено: 23:29 20-03-2002
Antuan



moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vpol

Цитата:
Грабление страниц  

Tavik

Цитата:
Есть только брать заголовки с сайтов

Иногда я пользуюсь услугами файла backend.php для грабления Заголовков с Нюке-сайтов. (впрочем, по умолчанию, есть список сайтов, откуда можно их брать - не обязательно с Нюке-сайтов...)

----------
EuRuChess

Всего записей: 10667 | Зарегистр. 10-04-2001 | Отправлено: 00:20 21-03-2002
Tavik



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Antuan

Цитата:
есть список сайтов, откуда можно их брать - не обязательно с Нюке-сайтов...)

это я и имел в виду, говоря..

Цитата:
специально настроенных.  

 
Просто неудачно выразился...

----------
http://www.HUB.ru - Все о Домашних Сетях России

Всего записей: 633 | Зарегистр. 23-01-2002 | Отправлено: 00:23 21-03-2002
Antuan



moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tavik

Цитата:
это я и имел в виду, говоря..  

Я знаю

----------
EuRuChess

Всего записей: 10667 | Зарегистр. 10-04-2001 | Отправлено: 00:35 21-03-2002
Tavik



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Antuan
откуда?

----------
http://www.HUB.ru - Все о Домашних Сетях России

Всего записей: 633 | Зарегистр. 23-01-2002 | Отправлено: 00:42 21-03-2002
vpol



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мужики!
От темы отклонились... Я жду конкретный совет!
То, что это на пхп возможно, я ранее где-то читал... Но как?

Всего записей: 858 | Зарегистр. 12-08-2001 | Отправлено: 08:17 21-03-2002
Uniq



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
Как можно простыми средствами сграбить эти страницы полностью или их фрагменты  

 
Я "граблю" погоду и гороскоп в блоки и ищу сайт для создания собственного раздела анекдотов :). Пример здесь - www.rikatv.kz
 
Готов ответить на вопросы.

Всего записей: 128 | Зарегистр. 30-07-2001 | Отправлено: 09:18 21-03-2002
vpol



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Uniq
Вопрос пока один... Как ты это делаешь?
И нельзя ли таким образом сграбить целую страницу или часть ее?
 

Всего записей: 858 | Зарегистр. 12-08-2001 | Отправлено: 11:12 21-03-2002
Uniq



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
vpol
Можно.
 

Код:
 
$content= fread(fopen("http://www.url.here", "r"), 100000);
if ($content)  
{  
$start= strpos($content, "откуда режем - уникальный хтмл-код!");  
$finish= strpos($content, "докуда режем - уникальный хтмл-код!");  
$length= $finish-$start;  
$code=Substr($content, $start, $length);  
}  
echo $code;
 

 
Ну и блоки примерно так и делаются.

Всего записей: 128 | Зарегистр. 30-07-2001 | Отправлено: 12:55 21-03-2002
adaptor



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Uniq
И воткнуть то как такой код? В тему что-ли вставлять?
В блоке то вот понятно куда его совать

Всего записей: 501 | Зарегистр. 04-11-2001 | Отправлено: 19:59 21-03-2002
vpol



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Лучше бы вообще конкретный пример привести...

Всего записей: 858 | Зарегистр. 12-08-2001 | Отправлено: 08:39 22-03-2002
tamon

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вроде бы делаю всё как написали-
 $content= fread(fopen("http://www.url.here", "r"), 100000);
if ($content)  
{  
$start= <div align="center">($content, "откуда режем - уникальный хтмл-код!");  
$finish= </form>($content, "докуда режем - уникальный хтмл-код!");  
$length= $finish-$start;  
$code=Substr($content, $start, $length);  
}  
echo $code;  
 
Но пишет ошибку Parse error: parse error, unexpected '<' in T:\home\localhost\index1.php on line 8
В чём проблемка?

Всего записей: 4 | Зарегистр. 17-07-2007 | Отправлено: 14:22 17-07-2007
Cheery



.:МордератоР:.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
tamon

Цитата:
$start= <div

ну и как это должно быть? если строковая переменная, то где кавычки?
 
плюс $start и $finish должны быть числовыми переменными

----------
Away/DND

Всего записей: 52737 | Зарегистр. 04-04-2002 | Отправлено: 20:39 17-07-2007
tamon

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Собствено требуется взять вот эту табличку, вы плиз обьясните на этом примере, а там всё станет уже ясно как делать
 

Код:
<div align="center">
 
                <table bgcolor="white" border="0" cellpadding="0" cellspacing="4" width="80%">
                    <tbody><tr class="news" align="left" valign="middle">
                    <td>
<form name="payform" id="payform" method="post" action="confirm.php" onsubmit="return checkForm('payform');">
 
<table border="1" cellpadding="2" cellspacing="2" width="100%">
<tbody><tr class="news">
    <td><label>текст:</label><br><font color="#ff3d00">(текст)</font></td>
    <td><label>текст:</label><br>текст</td>
    <td><label>текст:</label></td>
    <td><label>текст</label></td>
</tr>
 
<tr class="news">
    <td><input name="login" value="" maxlength="20" size="20" required="текст" type="text"></td>
    <td><input name="currency" value="ХХ" checked="checked" type="radio">ХХ&nbsp;
<input name="currency" value="ХХХ" type="radio">ХХХ&nbsp;</td>
    <td><input name="amount" value="" maxlength="10" size="5" required="Текст" valtype="float" type="input"></td>
    <td><input name="email" value="" maxlength="50" size="20" type="input"></td>
</tr>
<tr class="news">
    <td colspan="4" align="center" valign="middle"><input name="submit" value="&nbsp;Текст&nbsp;" type="submit"></td>
</tr>
 
</tbody></table>
 
</form>  

 
Есть статейка интересная ещё, про парсинг.... http://difour.org/blog/tag/grabber

Всего записей: 4 | Зарегистр. 17-07-2007 | Отправлено: 23:17 17-07-2007
Cheery



.:МордератоР:.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
tamon
читать
Граббер страницы с другого сайта
изучать регулярные выражения


----------
Away/DND

Всего записей: 52737 | Зарегистр. 04-04-2002 | Отправлено: 23:49 17-07-2007
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Тематические » Системы управления сайтами » Грабление страниц


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru