View previous topic :: View next topic |
Author |
Message |
wouzer Tux's lil' helper
Joined: 11 Feb 2003 Posts: 88 Location: The Hague, The Netherlands
|
Posted: Mon Jul 21, 2003 4:01 pm Post subject: Hulp bij reguliere expressies |
|
|
Dames (en heren),
Ik ben bezig met het omzetten van Multatuli's Max Havelaar van HTML naar PML (palm markup language). Ik probeer op dit moment "Eerste hoofdstuk" enz. te pakken met een reguliere expressie. Het punt is dat ie met de expressie die ik heb verzonnen ook zaken als "volgende hoofdstuk" mee pakt. Is er een RE expert die me opweg kan helpen?
Code: | [A-Z]{1}[a-z]{4,}(e )(hoofdstuk) |
Mocht iemand interesse hebben in de Max Havelaar in palm doc, laat me even weten, dan stuur ik 'm op.
Grtz,
Wouter _________________ It is better to keep your mouth closed and let people think you are a fool than to open it and remove all doubt. (Mark Twain) |
|
Back to top |
|
|
Sven Vermeulen Retired Dev
Joined: 29 Aug 2002 Posts: 1345 Location: Mechelen, Belgium
|
Posted: Tue Jul 22, 2003 10:58 am Post subject: |
|
|
Ik snap je vraag niet echt... als je met regexp's "Eerste hoofdstuk" wil pakken, geef je toch gewoon "Eerste hoofdstuk" in?
Kan je anders enkele regels van de HTML-code tonen en zeggen wat je eruit wil verkrijgen? |
|
Back to top |
|
|
wouzer Tux's lil' helper
Joined: 11 Feb 2003 Posts: 88 Location: The Hague, The Netherlands
|
Posted: Tue Jul 22, 2003 11:15 am Post subject: |
|
|
Sorry voor de onduidelijke vraagstelling. Een nieuwe poging:
Hoe kan je met een RE wel "Eerste hoofdtuk", "Tweede hoofdstuk", enz. pakken, maar "volgende hoofdstuk" en "vorige hoofdstuk" overslaan.
Ik moet namelijk om alle hoofdtukken "\X1" tags zetten.
Verder wil ik alle <a href="bla.html"> tags er uit halen. Ik heb ook geen idee hoe ik dat voor elkaar krijg.
In elk geval bedankt voor de hulp. _________________ It is better to keep your mouth closed and let people think you are a fool than to open it and remove all doubt. (Mark Twain) |
|
Back to top |
|
|
Sven Vermeulen Retired Dev
Joined: 29 Aug 2002 Posts: 1345 Location: Mechelen, Belgium
|
Posted: Thu Jul 24, 2003 3:07 pm Post subject: |
|
|
Voor de eerste/tweede enz: in de veronderstelling dat die altijd beginnen met een hoofdletter (dus "Eerste" ipv "eerste") zou ik het volgende proberen:
Code: |
[ETDVZAN][^o][a-z]*(de|ste) hoofdstuk
|
Om <a href="bla.html"> om te vormen naar bijvoorbeeld <uri link="bla.html"> (aangezien je niet vertelt wat je wil doen zal ik dat maar veronderstellen) gebruik ik het bolgende substitutie
Code: |
s/<a href=/<uri link=/
|
|
|
Back to top |
|
|
|