Megpróbálom megérteni a mintaillesztést, és nagyon megzavart az alábbi kód. A tudomásom szerint ellenőrzi, hogy van-e 2-5 nagybetűs darab a küldés végén. Ezután a számokkal határolt darabokat ""-re, a nagybetűs kisbetűs kisbetűket pedig ""-re cseréli.
Azt hiszem, tényleg nem értek valamit... Hogyan tudom megfejteni a re.sub sorokat?
Azt hiszem, a re.split felosztása a határoló alapján lett elküldve, ahol a . helyettesítő karaktert jelent?
Tudna valaki mutatni egy szemléltető példát?
import re
x=0
y=[]
while x<100:
sent = raw_input("gimmie a sentence")
if re.search('[A-Z]{2,5}$', sent):
print("HERE")
sent = re.sub('[0-9]+\.[0-9]+','<PAT1>', sent)
print(sent)
sent = re.sub(' [A-Z][a-z]+ [A-Z][a-z]+ [^A-Z]', '<PAT2>', sent)
print(sent)
y+=re.split('<PAT.>', sent)
x+= 1
print(x)
print(y)
print y
it checks to see if there is a chunk of 2-5 capital letters at the end of sent
akkor a következő: {2,3}={2,5}?? Megpróbáltam elmagyarázni a regex-et valami hiteles leíráson keresztül, csak mivel az OP megkövetelte 05.11.2015