Здравствуйте, может подскажете такой инструмент, с комощью которого можно находить ноды html страницы по xpath так же, как это можно делать при парсе xml? При этом все содержимое html хранится в виде строки
Ну, вот так, например
// xml -> String
String msgXML = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(new InputSource(new StringReader("<xml><is here = "true" /></xml>")));
// создать объект XPath
java.xml.xpath.XPath xpath = XPathFactory.newInstance().newXPath();
// выполнить поиск по xpath-выражению в строке
xpath.evaluate("//is[@here = 'true']", msgXML);
спасибо за наводку (см. пинок в правильную сторону), в итоге использовала net.sourceforge.htmlcleaner