Gentoo Forums
Gentoo Forums
Gentoo Forums
Quick Search: in
Hulp bij reguliere expressies
View unanswered posts
View posts from last 24 hours

 
Reply to topic    Gentoo Forums Forum Index Dutch
View previous topic :: View next topic  
Author Message
wouzer
Tux's lil' helper
Tux's lil' helper


Joined: 11 Feb 2003
Posts: 88
Location: The Hague, The Netherlands

PostPosted: Mon Jul 21, 2003 4:01 pm    Post subject: Hulp bij reguliere expressies Reply with quote

Dames (en heren),
Ik ben bezig met het omzetten van Multatuli's Max Havelaar van HTML naar PML (palm markup language). Ik probeer op dit moment "Eerste hoofdstuk" enz. te pakken met een reguliere expressie. Het punt is dat ie met de expressie die ik heb verzonnen ook zaken als "volgende hoofdstuk" mee pakt. Is er een RE expert die me opweg kan helpen?

Code:
[A-Z]{1}[a-z]{4,}(e )(hoofdstuk)


Mocht iemand interesse hebben in de Max Havelaar in palm doc, laat me even weten, dan stuur ik 'm op.
Grtz,

Wouter
_________________
It is better to keep your mouth closed and let people think you are a fool than to open it and remove all doubt. (Mark Twain)
Back to top
View user's profile Send private message
Sven Vermeulen
Retired Dev
Retired Dev


Joined: 29 Aug 2002
Posts: 1345
Location: Mechelen, Belgium

PostPosted: Tue Jul 22, 2003 10:58 am    Post subject: Reply with quote

Ik snap je vraag niet echt... als je met regexp's "Eerste hoofdstuk" wil pakken, geef je toch gewoon "Eerste hoofdstuk" in?

Kan je anders enkele regels van de HTML-code tonen en zeggen wat je eruit wil verkrijgen?
Back to top
View user's profile Send private message
wouzer
Tux's lil' helper
Tux's lil' helper


Joined: 11 Feb 2003
Posts: 88
Location: The Hague, The Netherlands

PostPosted: Tue Jul 22, 2003 11:15 am    Post subject: Reply with quote

Sorry voor de onduidelijke vraagstelling. Een nieuwe poging:

Hoe kan je met een RE wel "Eerste hoofdtuk", "Tweede hoofdstuk", enz. pakken, maar "volgende hoofdstuk" en "vorige hoofdstuk" overslaan.

Ik moet namelijk om alle hoofdtukken "\X1" tags zetten.

Verder wil ik alle <a href="bla.html"> tags er uit halen. Ik heb ook geen idee hoe ik dat voor elkaar krijg.

In elk geval bedankt voor de hulp.
_________________
It is better to keep your mouth closed and let people think you are a fool than to open it and remove all doubt. (Mark Twain)
Back to top
View user's profile Send private message
Sven Vermeulen
Retired Dev
Retired Dev


Joined: 29 Aug 2002
Posts: 1345
Location: Mechelen, Belgium

PostPosted: Thu Jul 24, 2003 3:07 pm    Post subject: Reply with quote

Voor de eerste/tweede enz: in de veronderstelling dat die altijd beginnen met een hoofdletter (dus "Eerste" ipv "eerste") zou ik het volgende proberen:
Code:

[ETDVZAN][^o][a-z]*(de|ste) hoofdstuk


Om <a href="bla.html"> om te vormen naar bijvoorbeeld <uri link="bla.html"> (aangezien je niet vertelt wat je wil doen zal ik dat maar veronderstellen) gebruik ik het bolgende substitutie
Code:

s/<a href=/<uri link=/
Back to top
View user's profile Send private message
Display posts from previous:   
Reply to topic    Gentoo Forums Forum Index Dutch All times are GMT
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum