艺术迷网
艺术迷 >> 网页设计 >> asp学习 >> 用正则表达式如何获取网页中URL及标题
2006-10-16   作者:佚名   来源:艺术迷收集(fansart.com)   点击:1565
页面功能: 【评论】有错就点】 【字体: 】 【打印】 【关闭【收藏本页】收藏到365Key
 
俺使用表达式"<a href=([^>]+)>([^<]+)</a>"
如何访问表达式中两个子集?

如网页中有内容

<a href=www.sina.com.cn>新浪</a>

如何能获得"www.sina.com.cn" 及 "新浪" 这两个子集呀。

谢谢指教了。


关注。。。


给你个例子先

Private Sub Command1_Click()
Dim reg As New RegExp
reg.IgnoreCase = True
reg.Global = True
reg.MultiLine = True

str1 = "<a href='aaa.htm'>11111</a><a href='bb.htm'>22222</a><a href='cc.htm'>33333</a>"

reg.Pattern = "<a href='(.*?).htm'>(.*?)</a>"

Set MC = reg.Execute(str1)

For Each m In MC


MsgBox m.SubMatches(0)
MsgBox m.SubMatches(1)
Next


End Sub


http://club.5ivb.net/UploadFile/20051704440byUID16899.rar


reg.Pattern = "<a href='(.*?).htm'>(.*?)</a>"

自在飞花兄,请问括号里面为什么要用个问号?这个问号表的是什么意义?
reg.Pattern = "<a href='(.*).htm'>(.*)</a>"

reg.Pattern = "<a href='([^']*).htm'>([^<]*)</a>"
这样不行吗?


自在飞花兄
m.SubMatches(1)

未找到方法及成员,俺用的是VB6.0,您说的是否适合 vb.net?

还有个用group 的吧?也是适合 vb.net吧


请教在VB6.0如何解决正则表达式中的子集呀。


我知道一个方法,用webbrowser中的 doument


to:phpro(killer)

? 当此字符紧随任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式是“非贪心的”。“非贪心的”模式匹配搜索到的、尽可能短的字符串,而默认的“贪心的”模式匹配搜索到的、尽可能长的字符串。例如,在字符串“oooo”中,“o+?”只匹配单个“o”,而“o+”匹配所有“o”。

若没有这个?,那么那个地址就会是:
aaa.htm'>11111</a><a href='bb.htm'>22222</a><a href='cc

我用的是vb6.0,不是.net


不用正则表达式,用这个,很简单:
set EventElement = external.menuArguments.document
msgbox EventElement.url+EventElement.title



声明:本站刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。如有疑问请与站长联系。
网友评论
目前没有评论!
发表评论
您的姓名: 匿名发送
电子邮件:
评论内容:
不能超过100个字符



所有留言只代表网友个人观点,不代表本站观点。
请各位遵纪守法并注意语言文明。
新闻搜索
关 键 词:
搜索范围:
全站精华
图文精彩
平面设计QQ群:42326012;技术群:38389792;
本站部分图文内容取自互联网。您若发现有侵犯您著作权行为,请及时告知,我们将在第一时间删除侵权作品、停止继续传播。
Copyright 2006-2007,版权所有 www.fansart.com tc_show@126.com QQ:44550498