移除HTML标签
方法一 : 禁用HTML 最简单的方法是直接禁用html标签而不用移除它们. 可以使用Replace()函数. 例如:
strText = Replace(strText, "<script", "<script", 1, -1, 1)
或者直接禁用所有的html: strText = Replace(strText, "<", "<")
这样做虽然很安全,但显得不够友好.(用户提交的文本会变得难以阅读)
方法二: 使用"<"和">" 怎样使得html标签从文本中消失呢? 我们可以去掉"<"和">"中间的所有内容
在JavaScript中这很简单:
function RemoveHTML( strText ) { var regEx = /<[^>]*>/g; return strText.replace(regEx, ""); }
关于正则表达式可以参考: http://developer.netscape.com/docs/manuals/js/client/jsguide/regexp.htm.
现在回到VBScript, 对于Scripting引擎5.0或更高版本(可以通过调用ScriptEngineMajorVersion和ScriptEngineMinorVersion函数来检验版本),我们也可以使用RegExp物体:
Function RemoveHTML( strText ) Dim RegEx
Set RegEx = New RegExp
RegEx.Pattern = "<[^>]*>" RegEx.Global = True
RemoveHTML = RegEx.Replace(strText, "") End Function
若不用正则表达式,下面的函数可以达到同样的目的:
Function RemoveHTML( strText ) Dim nPos1 Dim nPos2 nPos1 = InStr(strText, "<") Do While nPos1 > 0 nPos2 = InStr(nPos1 + 1, strText, ">") If nPos2 > 0 Then &nbs [1] [2] [3] [4] [5] [6] [7] [8] 下一页
|