Что нового

[Сеть, интернет] UDF FF.au3 - проблема с кодировкой

Orion_76

Новичок
Сообщения
2
Репутация
0
Пишу скрипт для автоматизации работы с web-страницами при помощи FireFox+MozRepl+FF.au3
Все здорово получается, вот только исходный код web-страницы скрипту от MozRepl приходит в непонятной кодировке.
Web-страница в 1251 кодировке.
Системная кодировка тоже 1251
функция TCPRecv получает символьные (не бинарные)данные от MozRepl... т.е. преобразует бинарный код в символы сама, как я думаю, в соответствии с настройками ОС, следовательно неправильные данные посылает MozRepl (да... нечитаемый только русский текст).

Есть какие нибудь мысли?

PS.. другие средства работы с вэб не предлагайте, основная задача - имитация действий пользователя в браузере.
 

Sp01LeR

Знающий
Сообщения
45
Репутация
12
На линуксе родная кодировка - UTF-8, соответственно, наверное самым простым методом будет перекодировка символов с кодом => 128 - возможно, что MozRepl отправляет битую кодировку...
 

beve

Осваивающий
Сообщения
104
Репутация
30
Orion_76 [?]
Есть какие нибудь мысли?
Увы решения нет для русских буковок, нужно обновлять-коректировать MozRepl, а это уже не делается. Поэтому осваивай TCPStartup, TCPSend, TCPRecv и прочее т.п.
 
Автор
O

Orion_76

Новичок
Сообщения
2
Репутация
0
Ладно...покопаемся в MozRepl...

Странно...подключаюсь к mozrepl через консоль, русские буквы отображаются соответственно "а б в г" - "P0 P1 P2 P3" т.е P- наверное идентификатор кодировки в таблице UTF-8, но в скрипте TCPRecv принимает в бинари уже без этих кодов. Так-то если к коду русского символа прибавить 176 - получившийся символ будет правильной русской буквой...но определить где русские а где символы с кодами 0-127 нет возможности...
 
Верх