Могу ли я использовать notepad ++ exe в своем приложении?

c# html-agility-pack htmltidy notepad++ winforms

Вопрос

Я анализирую html-файл с помощью пакета html agility для извлечения данных таблицы из html-файла. Но есть некоторые html-файлы, где нет конечных тегов, которые являются необязательными или нет стартового тега, который также является необязательным. Так что html-пакет гибкости не анализирует эту страницу html правильно. Если я открою содержимое этого html-файла в блокноте ++ затем с опцией TestFX-->TestFX HTML Tidy-->TiDy clean document и сделать контент таким же, как это. И теперь этот файл. Если я анализирую пакет html agility, тогда он разбирает его правильно.

Лучшим вариантом является создание html-страницы, аккуратной с помощью блокнота ++.

Поэтому я не знаю, но пользователь не может этого сделать, как сначала он / она делает страницу аккуратной с блокнотом ++, а затем продолжайте. Тогда что мне делать?

EDIT Я использовал html tidy pack, но в каком-то случае есть файл, который подобен тому, что не разбирается, но если я сделаю эту страницу аккуратной в блокноте ++, тогда она будет разобрана.

Принятый ответ

Я думаю, что Notepad ++ использует библиотеку HtmlTidy, и вы тоже. Главная страница здесь .

Или, может быть, вы можете использовать такую ​​услугу, как HrmlTidy online

Изменить: вы, похоже, хотите использовать блокнот ++ (поверх HtmlTidy). NP ++ имеет ограниченный набор параметров команды, поэтому загрузка файла не будет проблемой. Но я не мог найти ссылки на интерфейс, чтобы сделать остальную часть того, что вам нужно: убрать HTML и сохранить результаты.


Популярные ответы

HTML Tidy не зависит от Notepad ++, и вы можете использовать этот компонент с открытым исходным кодом непосредственно в своем проекте .NET (или на другом языке).

Более подробную информацию об использовании этого в .Net можно найти здесь



Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow