敏捷html解析器从缓冲区/流中读取

asp.net c# html html-agility-pack httpmodule

我试图在使用HTTP模块在浏览器中呈现之前更改HTML页面。我试图实现敏捷HTML解析器,但它似乎只是从文件中读取。

如何从缓冲区/流中读取它?

public override void Write(byte[] buffer, int offset, int count)
    {
      byte[] data = new byte[count];
      Buffer.BlockCopy(buffer, offset, data, 0, count);
      string html = System.Text.Encoding.Default.GetString(buffer);

      HtmlDocument doc = new HtmlDocument();
      doc.Load(html);
      foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
      {
      HtmlAttribute att = link["href"];
      att.Value = FixLink(att);
      }
    }

一般承认的答案

您应该能够使用MemoryStream读入数据:

public override void Write(byte[] buffer, int offset, int count)
{
  var stream = new MemoryStream(buffer, offset, count);

  HtmlDocument doc = new HtmlDocument();
  doc.Load(stream);

  foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
  {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
  }
}

热门答案

实际上HtmlDocument.Load()方法被重载并包含加载流的定义:加载(流),加载(流,布尔),加载(流,编码)。

您可以在http://htmlagilitypack.codeplex.com/的“下载”选项卡中找到相关文档。



Related

许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow