Python生成SitemapXML文件的示例代码
发布时间:2023-12-11 13:59:49
生成SitemapXML文件是为了告诉搜索引擎网站上的所有网页,以便它们可以更好地索引网站内容。下面是一个示例代码,用于生成SitemapXML文件,并附带一个使用例子:
import datetime
def generate_sitemap(urls):
sitemap_xml = '<?xml version="1.0" encoding="UTF-8"?>
'
sitemap_xml += '<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
'
for url in urls:
sitemap_xml += '<url>
'
sitemap_xml += '<loc>{}</loc>
'.format(url)
sitemap_xml += '<lastmod>{}</lastmod>
'.format(datetime.date.today())
sitemap_xml += '</url>
'
sitemap_xml += '</urlset>'
return sitemap_xml
# 生成SitemapXML文件
urls = [
'https://www.example.com/page1',
'https://www.example.com/page2',
'https://www.example.com/page3',
]
sitemap = generate_sitemap(urls)
# 将SitemapXML写入文件
with open('sitemap.xml', 'w') as file:
file.write(sitemap)
在上述示例中,generate_sitemap函数接受一个URL列表作为参数,并生成包含这些URL的SitemapXML文件。XML文件的结构符合Sitemaps协议。在每个URL的<loc>标签里添加网页的URL,<lastmod>标签里添加最后修改日期。
使用示例:
假设我们的网站有三个页面:https://www.example.com/page1、https://www.example.com/page2和https://www.example.com/page3。
我们调用generate_sitemap函数,传入包含这三个页面URL的列表。该函数会生成SitemapXML文件,并将其保存为sitemap.xml。
接下来,我们可以将生成的SitemapXML文件提交给搜索引擎,以便它们可以更好地了解我们网站上的内容,并进行索引。
请注意,在实际应用中,您应该根据您的需求和网站结构来生成SitemapXML文件,其中包括其他可选的标签如<changefreq>和<priority>。此示例仅为了简单起见,只包含必需的标签。
