<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>
<channel>
	<title>Kommentare zu: HTML elegant geparst mit dem Html-Agility-Pack</title>
	<atom:link href="http://blog.sternico.de/2008/08/html-elegant-geparst-mit-dem-html-agility-pack/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.sternico.de/2008/08/html-elegant-geparst-mit-dem-html-agility-pack/</link>
	<description>Sternico Blog</description>
	<pubDate>Thu, 29 Jul 2010 23:28:17 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.5</generator>
		<item>
		<title>Von: Werner Mager</title>
		<link>http://blog.sternico.de/2008/08/html-elegant-geparst-mit-dem-html-agility-pack/#comment-22228</link>
		<dc:creator>Werner Mager</dc:creator>
		<pubDate>Wed, 21 Jan 2009 21:23:17 +0000</pubDate>
		<guid isPermaLink="false">http://blog.sternico.de/?p=57#comment-22228</guid>
		<description>Hallo Daniel,

Danke für deinen Kommentar :) Sorry dass ich ihn jetzt erst sehe/freischalte/beantworte. 

Ich habe mir mal den Firebug installiert, das Plugin ist auf jeden Fall sehr nützlich! 

Bei meinen ersten Tests hat Firebug eigentlich ganz ordentliche XPath-Ausdrücke generiert, die auch Agility-Pack gültig sind. 

Firebug verwendet dabei als Kennzeichen das Attribut "id", (z.B. //*[@id="content-main"]) was sinnvoll ist falls das Element nicht immer an der gleichen Stelle im Dokument erscheint.
Hat das gewählte Element keine "id", so gibt Firebug den Pfad von ganz oben bis zu dem Element an. 

Beide Adress-Varianten hat das Agility-Pack bei mir problemlos akzeptiert. Einzig unschön ist vielleicht, dass Firebug für das erste Element nie einen Index vergibt (auch wenn es mehrere vom gleichen Typ gibt), wodurch das Agility-Pack u.U. mehrere Ergebnisse liefert, ob wohl nur ein Knoten gewünscht war.

z.B. : 
/html/body/div[2]/div[2]/div/h3/img
Statt
/html[1]/body[1]/div[2]/div[2]/div[1]/h3[1]/img[1]

Erstere Variante ist halt missverständlich, wenn unter dem letzten h3 mehrere img's kommen. (Alle Beispiele beziehen sich auf "https://addons.mozilla.org/de/firefox/addon/1843")

Hast du ansonsten mal ein konkretes Beispiel wo die XPath-Anweisung nicht paßt?

Gruß
Werner</description>
		<content:encoded><![CDATA[<p>Hallo Daniel,</p>
<p>Danke für deinen Kommentar <img src='http://blog.sternico.de/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> Sorry dass ich ihn jetzt erst sehe/freischalte/beantworte. </p>
<p>Ich habe mir mal den Firebug installiert, das Plugin ist auf jeden Fall sehr nützlich! </p>
<p>Bei meinen ersten Tests hat Firebug eigentlich ganz ordentliche XPath-Ausdrücke generiert, die auch Agility-Pack gültig sind. </p>
<p>Firebug verwendet dabei als Kennzeichen das Attribut &#8220;id&#8221;, (z.B. //*[@id=&#8221;content-main&#8221;]) was sinnvoll ist falls das Element nicht immer an der gleichen Stelle im Dokument erscheint.<br />
Hat das gewählte Element keine &#8220;id&#8221;, so gibt Firebug den Pfad von ganz oben bis zu dem Element an. </p>
<p>Beide Adress-Varianten hat das Agility-Pack bei mir problemlos akzeptiert. Einzig unschön ist vielleicht, dass Firebug für das erste Element nie einen Index vergibt (auch wenn es mehrere vom gleichen Typ gibt), wodurch das Agility-Pack u.U. mehrere Ergebnisse liefert, ob wohl nur ein Knoten gewünscht war.</p>
<p>z.B. :<br />
/html/body/div[2]/div[2]/div/h3/img<br />
Statt<br />
/html[1]/body[1]/div[2]/div[2]/div[1]/h3[1]/img[1]</p>
<p>Erstere Variante ist halt missverständlich, wenn unter dem letzten h3 mehrere img&#8217;s kommen. (Alle Beispiele beziehen sich auf &#8220;https://addons.mozilla.org/de/firefox/addon/1843&#8243;)</p>
<p>Hast du ansonsten mal ein konkretes Beispiel wo die XPath-Anweisung nicht paßt?</p>
<p>Gruß<br />
Werner</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: daniel</title>
		<link>http://blog.sternico.de/2008/08/html-elegant-geparst-mit-dem-html-agility-pack/#comment-22007</link>
		<dc:creator>daniel</dc:creator>
		<pubDate>Sat, 17 Jan 2009 18:34:15 +0000</pubDate>
		<guid isPermaLink="false">http://blog.sternico.de/?p=57#comment-22007</guid>
		<description>guter Beitrag!

den Xpath kann man relativ einfach mit dem Firefox-Plugin Firebug auslesen. dann muss man sich nicht wie im Visualizer durch den Baum hangeln.

Komischerweise unterscheiden sich aber die XPaths vom Html-Agility-Pack und von Firebug. Hast du irgendeine Lösung dafür?

Ich möchte eigentlich den XPath über Firebug bekommen, weil das nicht so aufwendig ist.</description>
		<content:encoded><![CDATA[<p>guter Beitrag!</p>
<p>den Xpath kann man relativ einfach mit dem Firefox-Plugin Firebug auslesen. dann muss man sich nicht wie im Visualizer durch den Baum hangeln.</p>
<p>Komischerweise unterscheiden sich aber die XPaths vom Html-Agility-Pack und von Firebug. Hast du irgendeine Lösung dafür?</p>
<p>Ich möchte eigentlich den XPath über Firebug bekommen, weil das nicht so aufwendig ist.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Werner Mager</title>
		<link>http://blog.sternico.de/2008/08/html-elegant-geparst-mit-dem-html-agility-pack/#comment-20</link>
		<dc:creator>Werner Mager</dc:creator>
		<pubDate>Sun, 24 Aug 2008 17:59:43 +0000</pubDate>
		<guid isPermaLink="false">http://blog.sternico.de/?p=57#comment-20</guid>
		<description>Beim Vortrag kam u.a. auch die Frage auf, ob man das AgilityPack auch mit Linq benutzen kann. 

Antwort: JA :) 

Hier steht wie es geht:
&lt;a href="http://vijay.screamingpens.com/archive/2008/05/26/linq-amp-lambda-part-3-html-agility-pack-to-linq.aspx" target="_blank" rel="nofollow"&gt;http://vijay.screamingpens.com/archive/2008/05/26/linq-amp-lambda-part-3-html-agility-pack-to-linq.aspx&lt;/a&gt;</description>
		<content:encoded><![CDATA[<p>Beim Vortrag kam u.a. auch die Frage auf, ob man das AgilityPack auch mit Linq benutzen kann. </p>
<p>Antwort: JA <img src='http://blog.sternico.de/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>Hier steht wie es geht:<br />
<a href="http://vijay.screamingpens.com/archive/2008/05/26/linq-amp-lambda-part-3-html-agility-pack-to-linq.aspx" target="_blank" rel="nofollow">http://vijay.screamingpens.com/archive/2008/05/26/linq-amp-lambda-part-3-html-agility-pack-to-linq.aspx</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Werner Mager</title>
		<link>http://blog.sternico.de/2008/08/html-elegant-geparst-mit-dem-html-agility-pack/#comment-19</link>
		<dc:creator>Werner Mager</dc:creator>
		<pubDate>Wed, 20 Aug 2008 14:45:33 +0000</pubDate>
		<guid isPermaLink="false">http://blog.sternico.de/?p=57#comment-19</guid>
		<description>Hallo Karim,

der Tip mit dem HtmlDecode funktioniert, ich habe es gleich eingebaut und den Download aktualisiert. Hat zwar einen Moment gedauert, bis ich drauf gekommen bin, dass ich die System.Web zu den Ressourcen zufügen muß, aber danach hats geklappt.
Den Mitschnitt des Vortrags werde ich demnächst noch hochladen, ich wollte vorher nur noch die Passagen mit den Audio-Problemen abschneiden.

Gruß
Werner</description>
		<content:encoded><![CDATA[<p>Hallo Karim,</p>
<p>der Tip mit dem HtmlDecode funktioniert, ich habe es gleich eingebaut und den Download aktualisiert. Hat zwar einen Moment gedauert, bis ich drauf gekommen bin, dass ich die System.Web zu den Ressourcen zufügen muß, aber danach hats geklappt.<br />
Den Mitschnitt des Vortrags werde ich demnächst noch hochladen, ich wollte vorher nur noch die Passagen mit den Audio-Problemen abschneiden.</p>
<p>Gruß<br />
Werner</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Karim</title>
		<link>http://blog.sternico.de/2008/08/html-elegant-geparst-mit-dem-html-agility-pack/#comment-18</link>
		<dc:creator>Karim</dc:creator>
		<pubDate>Wed, 20 Aug 2008 14:03:00 +0000</pubDate>
		<guid isPermaLink="false">http://blog.sternico.de/?p=57#comment-18</guid>
		<description>Hallo Werner,

die HTML Steuerzeichen in den geparsten Texten kannst Du mit System.Web.HttpUtility.HtmlDecode() bereinigen.

Gruß und Danke für den Vortrag
Karim</description>
		<content:encoded><![CDATA[<p>Hallo Werner,</p>
<p>die HTML Steuerzeichen in den geparsten Texten kannst Du mit System.Web.HttpUtility.HtmlDecode() bereinigen.</p>
<p>Gruß und Danke für den Vortrag<br />
Karim</p>
]]></content:encoded>
	</item>
</channel>
</rss>
