使用HTML Agility Pack在HTML源代码中添加换行符

html html-agility-pack vb.net

我正在使用HTML Agility Pack修改HTML文件。

以下是包含表格的HTML文件的示例:

Dim document As New HtmlDocument
Dim tables As Array

document.Load(path_html)

Dim div1 As HtmlNode = HtmlNode.CreateNode("<div></div>")
Dim div2 As HtmlNode = HtmlNode.CreateNode("<div></div>")

tables = document.DocumentNode.Descendants("table").ToArray()

For Each tr As HtmlNode In tables.Descendants("tr").ToArray
   tr.AppendChild(div1)
   tr.AppendChild(div2)
Next

document.save(path_html)

这是HTML文件中的结果:

<div></div><div></div>

我想要的是:

<div></div>
<div></div>

我认为这应该默认实现,因为它使我的HTML文件不清楚。

我在这里看到了这个问题(这是我的确切问题) 但答案对我不起作用(也许是因为VB.NET,答案是C#)。

有人可以帮忙吗?

一般承认的答案

没有在很长一段时间内写过任何vb.net ,所以首先在C#尝试过这个:

var document = new HtmlDocument();
var div = HtmlNode.CreateNode("<div></div>");
var newline = HtmlNode.CreateNode("\r\n");
div.AppendChild(newline);
for (int i = 0; i < 2; ++i)
{
    div.AppendChild(HtmlNode.CreateNode("<div></div>"));
    div.AppendChild(newline);
}
document.DocumentNode.AppendChild(div);
Console.WriteLine(document.DocumentNode.WriteTo());

效果很好 - 输出:

<div>
<div></div>
<div></div>
</div>

然后想,“ 没办法....它不可能 ” - 请注意注释的行:

Dim document = New HtmlDocument()
Dim div = HtmlNode.CreateNode("<div></div>")
' this writes the literal string...
Dim newline = HtmlNode.CreateNode("\r\n")
' this works!
' Dim newline = HtmlNode.CreateNode(Environment.NewLine)
div.AppendChild(newline)
For i = 1 To 2
    div.AppendChild(HtmlNode.CreateNode("<div></div>"))
    div.AppendChild(newline)
Next
document.DocumentNode.AppendChild(div)
Console.WriteLine(document.DocumentNode.WriteTo())

不幸的是它是这样的,也可能是为什么你链接问题没有标记为答案 - 输出:

<div>\r\n<div></div>\r\n<div></div>\r\n</div>

最后,不要使用新行字符串作为\r\n尝试使用Environment.NewLine ,它可以工作和输出:

<div>
<div></div>
<div></div>
</div>

在C#中以任何一种方式工作。


热门答案

根据此答案,您需要添加一个表示回车符( \r )和换行符( \n )的节点:

Dim newLineNode As HtmlNode = HtmlNode.CreateNode("\r\n")

根据您的评论:

我尝试了这个,但它在我的HTML中添加'\ r \ n',它不会回到行。

你已经尝试了这个,而是打印字符串文字“\ r \ n”。我也设法复制了这个问题。

而是使用<br>作为换行符:

Dim newLineNode As HtmlNode = HtmlNode.CreateNode("<br>")

根据您的示例代码,您的代码将如下所示:

Dim newLineNode As HtmlNode = HtmlNode.CreateNode("<br>")

For Each tr As HtmlNode In tables.Descendants("tr").ToArray
   tr.AppendChild(div1)
   tr.AppendChild(newLineNode)
   tr.AppendChild(div2)
Next

但是tables.Descendants("tr").ToArray确实为我提供了编译错误。由于这不属于这个问题的范围,你没有提出它作为一个问题,我会假设它适合你。



Related

许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因