Как извлечь значения в кавычки из строки HTML?

c# html html-agility-pack javascript web-scraping

Вопрос

У меня есть следующий фрагмент кода, полученный с веб-страницы:

<li class="player" data-id="168568" data-teamid="156" data-x="142.33" data-y="297.16040000000004" data-name="Corentin Tolisso" data-position="3">Corentin Tolisso<span class="shirt">24</span></li>

Моя цель - вывести «Corentin Tolisso», номер рубашки «24», а также значения данных-x и data-y.

Пока я могу заставить его работать со значениями, которые находятся внутри >...< , используя пакет гибкости HTML.

Однако я не могу найти способ извлечения данных data-x и data-y.

Я скопировал строку HTML в новый jsfiddle, который выражает то, что получает мой код C #, вещи между >...< .

Как извлечь значения данных-x и data-y?

Примечание. Использование String.IndexOf отлично работает, однако оно String.IndexOf гибкость. Это моя резервная стратегия.

Примечание 2: Я посмотрел здесь и здесь , оба из которых дают мне некоторую идею, но мне сложно с этим обращаться к C #.

Популярные ответы

1 путь будет использоваться (["'])(?:(?=(\\?))\2.)*?\1 Он также поддерживает вложенные кавычки

Попробуйте эту ссылку: https://regex101.com/r/cB0kB8/1

С JQuery это делает его очень простым.

Также проверьте пример, найденный здесь: Получение значения ввода текста HTML

<form name="input" action="handle_email.php" method="post">
Email: <input type="text" name="email" />
<input type="submit" value="Newsletter" />
</form> 
<a id="regLink" href="http://mywebsite.com/register?user_email=">Register</a>

$('input[name="email"]').change(function(){
alert($('#regLink').attr('href')+$('input[name="email"]').val());
});

Надеюсь, это поможет вам!



Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему