Здравствуйте! Помогите пожалуйста извлечь из текста нужные японские иероглифы, перевод и описание к ним.
Пример:
Интересуют нас строки 2,3,4,5
2 - Кандзи иероглиф - 水
3 - Перевод иероглифа - вода
4 - Онное произношение записаное азбукой Хирагана (すい) и на кирилице (суи)
5 - Кунное произношение записаное азбукой Хирагана (みず) и на кирилице (мидзу)
Нам же надо извлечь эти данные и записать в текстовый файл в следующем формате:
[иероглиф из строки 2][таб][перевод из строки 3][ | ][ онное произношение на хирагане из строки 4][пробел][онное произношение на кирилице из строки 4][ | ][кунное произношение на хирагане из строки 5][пробел][кунное произношение на кирилице из строки 5]
На выходе получаем файл с следующим содержанием:
水 вода | すい суи | みず мидзу
一 один | いち ити | ひと хито
二 два | に ни | ふた фута
三 три | さん сан | み ми
四 четыре | し си | よ ё
Также иногда некоторые данные могут отсутствовать :
Например в описании иероглифа может не быть произношения Он или Кун или того и другого одновременно, в итоге на выходе мы должны получить следующее.
Нету произношения Кун
王 правитель | おう оу |
Нету произношения Он
生 необработанный | | なま нама
Нету того и другого
赤 красный цвет | |
Наверное можно было обьяснить и проще, извините за много букв.
Код:
...
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E4%B8%80">
一</A></DIV></TD>
<TD >один</TD>
<TD >いち<DIV><FONT color='#AAAAAA'>ити</FONT><DIV></TD>
<TD >ひと<DIV><FONT color='#AAAAAA'>хито</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E4%BA%8C">
二</A></DIV></TD>
<TD >два</TD>
<TD >に<DIV><FONT color='#AAAAAA'>ни</FONT><DIV></TD>
<TD >ふた<DIV><FONT color='#AAAAAA'>фута</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E4%B8%89">
三</A></DIV></TD>
<TD >три</TD>
<TD >さん<DIV><FONT color='#AAAAAA'>сан</FONT><DIV></TD>
<TD >み<DIV><FONT color='#AAAAAA'>ми</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E5%9B%9B">
四</A></DIV></TD>
<TD >четыре</TD>
<TD >し<DIV><FONT color='#AAAAAA'>си</FONT><DIV></TD>
<TD >よ<DIV><FONT color='#AAAAAA'>ё</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E4%BA%94">
五</A></DIV></TD>
<TD >пять</TD>
<TD >ご<DIV><FONT color='#AAAAAA'>го</FONT><DIV></TD>
<TD >いつ<DIV><FONT color='#AAAAAA'>ицу</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E5%85%AD">
六</A></DIV></TD>
<TD >шесть</TD>
<TD >ろく<DIV><FONT color='#AAAAAA'>року</FONT><DIV></TD>
<TD >む<DIV><FONT color='#AAAAAA'>му</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E4%B8%83">
七</A></DIV></TD>
<TD >семь</TD>
<TD >しち<DIV><FONT color='#AAAAAA'>сити</FONT><DIV></TD>
<TD >なな<DIV><FONT color='#AAAAAA'>нана</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E5%85%AB">
八</A></DIV></TD>
<TD >восемь</TD>
<TD >はち<DIV><FONT color='#AAAAAA'>хати</FONT><DIV></TD>
<TD >や<DIV><FONT color='#AAAAAA'>я</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E4%B9%9D">
九</A></DIV></TD>
<TD >девять</TD>
<TD >きゅう<DIV><FONT color='#AAAAAA'>кюу</FONT><DIV></TD>
<TD >ここの<DIV><FONT color='#AAAAAA'>коконо</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E5%8D%81">
十</A></DIV></TD>
<TD >десять</TD>
<TD >じゅう<DIV><FONT color='#AAAAAA'>дзюу</FONT><DIV></TD>
<TD >とお<DIV><FONT color='#AAAAAA'>тоо</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E7%99%BE">
百</A></DIV></TD>
<TD >сто</TD>
<TD >ひゃく<DIV><FONT color='#AAAAAA'>хяку</FONT><DIV></TD>
<TD >もも<DIV><FONT color='#AAAAAA'>момо</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E5%8D%83">
千</A></DIV></TD>
<TD >тысяча</TD>
<TD >せん<DIV><FONT color='#AAAAAA'>сэн</FONT><DIV></TD>
<TD >ち<DIV><FONT color='#AAAAAA'>ти</FONT><DIV></TD>
</TR>
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E4%B8%8A">
上</A></DIV></TD>
<TD >наверху</TD>
<TD >じょう<DIV><FONT color='#AAAAAA'>дзёу</FONT><DIV></TD>
<TD >うえ<DIV><FONT color='#AAAAAA'>уэ</FONT><DIV></TD>
</TR>
...
Пример:
Код:
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E6%B0%B4">
水</A></DIV></TD>
<TD >вода</TD>
<TD >すい<DIV><FONT color='#AAAAAA'>суи</FONT><DIV></TD>
<TD >みず<DIV><FONT color='#AAAAAA'>мидзу</FONT><DIV></TD>
</TR>
Интересуют нас строки 2,3,4,5
2 - Кандзи иероглиф - 水
3 - Перевод иероглифа - вода
4 - Онное произношение записаное азбукой Хирагана (すい) и на кирилице (суи)
5 - Кунное произношение записаное азбукой Хирагана (みず) и на кирилице (мидзу)
Нам же надо извлечь эти данные и записать в текстовый файл в следующем формате:
[иероглиф из строки 2][таб][перевод из строки 3][ | ][ онное произношение на хирагане из строки 4][пробел][онное произношение на кирилице из строки 4][ | ][кунное произношение на хирагане из строки 5][пробел][кунное произношение на кирилице из строки 5]
На выходе получаем файл с следующим содержанием:
水 вода | すい суи | みず мидзу
一 один | いち ити | ひと хито
二 два | に ни | ふた фута
三 три | さん сан | み ми
四 четыре | し си | よ ё
Также иногда некоторые данные могут отсутствовать :
Например в описании иероглифа может не быть произношения Он или Кун или того и другого одновременно, в итоге на выходе мы должны получить следующее.
Нету произношения Кун
王 правитель | おう оу |
Код:
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E7%8E%8B">
王</A></DIV></TD>
<TD >правитель</TD>
<TD >おう <DIV><FONT color='#AAAAAA'>оу</FONT><DIV></TD>
<TD ><DIV><FONT color='#AAAAAA'></FONT><DIV></TD>
</TR>
Нету произношения Он
生 необработанный | | なま нама
Код:
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E7%94%9F">
生</A></DIV></TD>
<TD >необработанный</TD>
<TD ><DIV><FONT color='#AAAAAA'></FONT><DIV></TD>
<TD >なま<DIV><FONT color='#AAAAAA'>нама</FONT><DIV></TD>
</TR>
Нету того и другого
赤 красный цвет | |
Код:
<TR ><TD class="HintDataTableCell" onMouseOver="javascript:showsmarttip(this,event,'center',7);" onMouseOut="javascript:hidetip();" ><DIV><A href="kandzi_view.php?kandzi=%E8%B5%A4">
赤</A></DIV></TD>
<TD >красный цвет</TD>
<TD ><DIV><FONT color='#AAAAAA'></FONT><DIV></TD>
<TD ><DIV><FONT color='#AAAAAA'></FONT><DIV></TD>
</TR>
Наверное можно было обьяснить и проще, извините за много букв.