man_without_face
Новичок
- Сообщения
- 17
- Репутация
- 0
Всем здравствуйте!
Начал осваивать нашу замечательную программу только недавно. Делаю на работе один проект по автоматизированной обработке анкет. На данный момент столкнулся с такой вот задачей.
Имеются анкеты, в которых формируется машиносчитываемый блок. Анкеты распознаются сканированием и результат помещается в текстовый файл. Текст содержит много лишней информации, т.к. при поточном сканировании в зону распознавания могут попасть лишние данные. Нужные блоки выделены тегами "<" и ">" - в них содержатся данные с разделителем в виде ";". В тексте таких блоков много - по количеству анкет. За раз от 10 до 50, может и больше.
Считывать файл с такими данными (где каждая строка с разделителями относится к одной записи, количество строк не ограничено) и вносить их в программу уже могу. Но теперь нужно создать такой файл из получаемого при распознавании текста.
Таким образом есть текст " какой-то текст <фамилия;имя;...> ещё текст <фамилия;имя;...> ещё текст..."
Надо получить
"Фамилия;имя
Фамилия;имя
...
"
Либо сразу помещать в двухмерный массив. Количество столбцов всегда 25, строк - по количеству анкет.
Буду благодарен за любую помощь.
Начал осваивать нашу замечательную программу только недавно. Делаю на работе один проект по автоматизированной обработке анкет. На данный момент столкнулся с такой вот задачей.
Имеются анкеты, в которых формируется машиносчитываемый блок. Анкеты распознаются сканированием и результат помещается в текстовый файл. Текст содержит много лишней информации, т.к. при поточном сканировании в зону распознавания могут попасть лишние данные. Нужные блоки выделены тегами "<" и ">" - в них содержатся данные с разделителем в виде ";". В тексте таких блоков много - по количеству анкет. За раз от 10 до 50, может и больше.
Считывать файл с такими данными (где каждая строка с разделителями относится к одной записи, количество строк не ограничено) и вносить их в программу уже могу. Но теперь нужно создать такой файл из получаемого при распознавании текста.
Таким образом есть текст " какой-то текст <фамилия;имя;...> ещё текст <фамилия;имя;...> ещё текст..."
Надо получить
"Фамилия;имя
Фамилия;имя
...
"
Либо сразу помещать в двухмерный массив. Количество столбцов всегда 25, строк - по количеству анкет.
Буду благодарен за любую помощь.