欢迎访问宙启技术站
智能推送

使用strip_tags()函数从HTML标签中提取文本

发布时间:2023-06-19 13:24:07

在现今的互联网时代中,HTML标签已成为网页内容的重要组成部分。HTML标签的作用是将信息以一定的格式和样式展现出来,但是在很多情况下我们需要从网页中获取纯文本,这就需要使用strip_tags()函数来去除HTML标签。

strip_tags()函数是一种PHP函数,它可以去掉字符串中的HTML以及PHP标签,并返回纯文本内容。在使用这个函数时,需要注意有些HTML标签是可以在文本中保留的,例如<strong>和<em>标签,这些标签并不会影响文本的内容,所以需要使用额外的参数过滤掉这些标签。

下面是一个使用strip_tags()函数去除HTML标签的示例:

$string = '<a href="https://www.example.com">Example.com</a> is a great website!';

//去除HTML标签并返回文本内容
$text = strip_tags($string);

echo $text;
//输出:Example.com is a great website!

这个例子中,我们传递一个包含HTML标签的字符串到strip_tags()函数中,它会自动去掉链接标签并返回纯文本内容。

除了基本的用法外,strip_tags()函数还可以接受第二个参数,表示保留一些指定的HTML标签。例如,我们可以保留<strong>和<em>标签,同时去除其他HTML标签,方法如下:

$string = '<strong>Hello</strong> <em>world!</em> <a href="https://www.example.com">Example.com</a> is a great website!';

//保留<strong>和<em>标签并去除其他标签
$text = strip_tags($string, '<strong><em>');

echo $text;
//输出:Hello world!

在这个例子中,我们传递了一个第二个参数,它告诉strip_tags()函数只保留<strong>和<em>标签,并去除其他HTML标签。

总之,strip_tags()函数是一个非常有用的函数,可以在提取页面纯文本时节省大量时间和精力。无论是处理用户输入还是处理爬取的网页内容,都可以使用这个函数来去除HTML标签,得到所需的纯文本。