如何用正则表达式去掉html标签

2024-11-23 10:09:23
推荐回答(4个)
回答1:

1、正则表达式去掉html标签代码如下:
///

/// 去除 HTML tag
///

///
/// 结果 public static string StripHTML(string HTML) //google "StripHTML" 得到{ string[] Regexs =
{
@"]*?>.*?",
@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
@"([\r\n])[\s]+",
@"&(quot|#34);",
@"&(amp|#38);",
@"&(lt|#60);",
@"&(gt|#62);",
@"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(copy|#169);",
@"&#(\d+);",
@"-->",
@"