正则表达式中使用问号可以取消贪婪模式

使用正则表达式抽取整个页面的特定内容是非常方便的，但在使用时有一些细节问题还是很关键的，比如合理的使用问号（?）可以取消贪婪的抽取问题。

比如页面中包含有很多段...，如果我们使用下面的方法抽取：

[csharp toolbar="false"]
Regex rx = new Regex("(.*)");
Match match = rx.Match(str); // match.NextMatch(); 可用来取下一个
[/csharp]

结果是只提出一个，内容是从第一个开始到最后一个结束。

这里我们只要加上问号，如下代码：

[csharp toolbar="false"]
Regex rx = new Regex("(.*?)");
Match match = rx.Match(str);
[/csharp]

这时提到出来的就是一个个独立的...，有时这才是我们想要的。

另外上面正则表达式里的括号也很有用，使用match.Group[0]得到匹配的结果，用match.Group[1]即得到括号中的内容。有多个括号按从外到内、从左到右的原则依次从Group里取。

PS. C#中还有个Group的概念，挺鬼异的，这里有解释，抽空研究一下：http://blog.csdn.net/zhoufoxcn/archive/2010/03/09/5358644.aspx

Updated：更多正则表达式的揭密参见这里：http://www.regexlab.com/zh/regref.htm

Tags: C#/.NET, 技巧

This entry was posted on 星期五, 27 8 月, 2010 at 13:45 and is filed under 东东博客. You can follow any responses to this entry through the RSS 2.0 feed. You can leave a response, or trackback from your own site.

2 Responses to “正则表达式中使用问号可以取消贪婪模式”

S_niper说道：

2010年09月15日 11:23

嗯~贪婪模式这个名字有点儿意思

回复
谋定而后动 » 正则表达式的 ? 取代贪婪匹配说道：

2011年09月15日 11:31

[...] 先说明一下<pre> .*?</pre> 的作用。本来我也稀里糊涂，看过/wp/post/1127.html 才有所了解。 [...]

回复

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

LorDong's Blog