Что нового

[Сеть, интернет] Получение HTML web-страницы без браузера

Kroid

Новичок
Сообщения
2
Репутация
2
Ребят, есть такой вопрос. Допустим, мне надо спарсить текст на сайте. В php я это сделаю через curl и при запуске скрипта я получу спарсенный текст без всяких дополнительных действий и открываний окон.

А как это дело в автоите обстоит? Я могу сделать так: открыть окно браузера, перейти на сайт, скопировать текст, открыть блокнот, вставить текст, сохранить. А возможно ли проделать такое без мельтешений разных окон на экране? Если да, приведите простенький пример на пару строчек, который показывает реализацию любого подобного алгоритма.
 

`p r o x y

«Улыбайтесь, господа!»
Команда форума
Глобальный модератор
Сообщения
596
Репутация
157
Re: [Сеть, интернет] есть ли в автоите аналог curl'a в php

Kroid [?]
php я это сделаю через curl
А с помощью file_get_contents не проще?

1. Советую не лениться и прочитать справку. Она не большая, за то 50-80% вопросов уже будет решено.

2. InetRead, примеры в справке.

3.
Предупреждение За нарушение общих правил (пункт В.8):
Так как эта конференция называется "Русское сообщество AutoIt", язык общения на ней - Русский. Названия фирм или программных продуктов, аббревиатуры и т.д. должны быть написаны так, как они пишутся в оригинале, например не следует писать УСБ вместо USB. На форуме крайне не рекомендуется намеренно искажать русский язык и использовать "сетевой жаргон" на подобии "Аффтар выпей йадау!".


С уважением, Модератор форума.




Исправьте, пожалуйста (название и текст темы).

4. Тему лучше переименовать, например:
"Получение HTML web-страницы без браузера"
 

HelpMe

Новичок
Сообщения
85
Репутация
3
UP
ну только пример... ваши справки мало понятны!
 

Garrett

Модератор
Локальный модератор
Сообщения
3,999
Репутация
967
Ну откуда такая лень читать справку?
Код:
InetGet("http://www.mozilla.org", @ScriptDir & "\mozilla.html")



Добавлено:
Сообщение автоматически объединено:

HelpMe [?]
ваши справки мало понятны!
И что тут непонятного?
 

HelpMe

Новичок
Сообщения
85
Репутация
3
это также тяжело - как читать сверхвысшую математику :(
там объяснения не на русском, а для какихто продвинутых или я так глуп... да и справка у меня частично русская частично английская :(
 

Garrett

Модератор
Локальный модератор
Сообщения
3,999
Репутация
967
HelpMe [?]
да и справка у меня частично русская частично английская

Помните: - "Кто там? Кто там?"
В итоге скворец заговорил ;)

Если вы будите себя заставлять хотя бы часто употребляемые слова вспоминать на память то в скором будущем если не говорить, то понимать точно сможете.
А на время работы в сложных и непонятных ситуациях рекомендую GTranslate
 

HelpMe

Новичок
Сообщения
85
Репутация
3
вы правы, всё дело в нашей лени, но вы нас наставляйте и не уставайте...
с InetGet - всё понятно... а вот можно сделать так - чтобы $yyy = тексту полученного файла? и стоит ли использывать InetGet при этой задаче? ели можно - тогда мы сможем взять нужное и убрать лишнее при помощи String-оф - верно?
 

Garrett

Модератор
Локальный модератор
Сообщения
3,999
Репутация
967
HelpMe [?]
а вот можно сделать так - чтобы $yyy = тексту полученного файла?
Код:
$sHTML = BinaryToString(InetRead("http://yandex.ru/yandsearch?text=Autoit&lr=Autoit"), 4)
ConsoleWrite($sHTML & @CRLF)
 

Zaramot

I ♥ AutoIt
Сообщения
1,160
Репутация
660
Код:
#Include <INet.au3> ;Подключаем библиотеку

$HTML = _INetGetSource('http://www.google.ru/') ;Получаем HTML код страницы
FileWrite(@ScriptDir & '\HTML.txt', $HTML) ;Записываем полученный код в файл
 

HelpMe

Новичок
Сообщения
85
Репутация
3
можете проверить _INetGetSource и InetRead на https://***.***.***.*** работает? там еще надо пароль указывать....
у меня просто http:// получается а на https:// - нет

если да? можете указать альтернативу?


Добавлено:
Сообщение автоматически объединено:

может это мешает:
Ошибка в сертификате безопасности этого веб-узла.


Сертификат безопасности этого веб-узла не был выпущен доверенным центром сертификации.
Срок действия сертификата безопасности этого веб-узла истек или еще не начинался.
Сертификат безопасности этого веб-узла был выпущен для веб-узла с другим адресом.

Наличие ошибок в сертификате безопасности может означать, что вас пытаются обмануть или хотят перехватить информацию, передаваемую на сервер.
Рекомендуется закрыть веб-страницу и не работать с этим веб-узлом.
Щелкните здесь, чтобы закрыть веб-страницу.
Продолжить открытие этого веб-узла (не рекомендуется).
Подробнее


Если, щелкнув ссылку, вы попали на эту веб-страницу, проверьте адрес веб-узла на панели адреса, чтобы убедиться в том, что он указан правильно.
При переходе на веб-узел с адресом https://example.com попробуйте добавить к адресу 'www', например, https://www.example.com.
Если вы хотите проигнорировать эту ошибку и продолжить, по крайней мере не вводите никаких личных данных и не сообщайте конфиденциальных сведений на этом веб-узле!

Дополнительные сведения можно найти в разделе справки Internet Explorer "Ошибки сертификатов".

:scratch:
 

HelpMe

Новичок
Сообщения
85
Репутация
3
Можыт это?
Код:
FtpSetProxy ( mode [, "proxy:port" [, "username", "password"]] )


Помогите с комбинацией - не могу понять....
Код:
$sHTML = BinaryToString(InetRead("https://***.***.***.***:7070/*"), 4)
FileWrite(@ScriptDir & '\HTML.txt', $sHTML) ;Записываем полученный код в файл
 

HelpMe

Новичок
Сообщения
85
Репутация
3
С авторизацией помоему трабла... :blink:
 

zlo-kazan

Скриптер
Сообщения
374
Репутация
100
Тебе нужно, чтобы окошко браузера не появлялось или понять, как общаться с сервером на уровне GET/POST запросов? :smile:
 

HelpMe

Новичок
Сообщения
85
Репутация
3
zlo-kazan - мне нужно всё
Zaramot - там был, спасибо... там надо как машина думать... т.е. хорошо понимать автоит...

анализатор уловил (HttpAnalyzer) при входе...

Authorization: Basic ZHJNaXJha292dTpjR2ZoNTZralI=
 
Верх