欢迎访问宙启技术站
智能推送

Python生成SitemapXML文件的示例代码

发布时间:2023-12-11 13:59:49

生成SitemapXML文件是为了告诉搜索引擎网站上的所有网页,以便它们可以更好地索引网站内容。下面是一个示例代码,用于生成SitemapXML文件,并附带一个使用例子:

import datetime

def generate_sitemap(urls):
    sitemap_xml = '<?xml version="1.0" encoding="UTF-8"?>
'
    sitemap_xml += '<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
'

    for url in urls:
        sitemap_xml += '<url>
'
        sitemap_xml += '<loc>{}</loc>
'.format(url)
        sitemap_xml += '<lastmod>{}</lastmod>
'.format(datetime.date.today())
        sitemap_xml += '</url>
'

    sitemap_xml += '</urlset>'
    return sitemap_xml

# 生成SitemapXML文件
urls = [
    'https://www.example.com/page1',
    'https://www.example.com/page2',
    'https://www.example.com/page3',
]

sitemap = generate_sitemap(urls)

# 将SitemapXML写入文件
with open('sitemap.xml', 'w') as file:
    file.write(sitemap)

在上述示例中,generate_sitemap函数接受一个URL列表作为参数,并生成包含这些URL的SitemapXML文件。XML文件的结构符合Sitemaps协议。在每个URL的<loc>标签里添加网页的URL,<lastmod>标签里添加最后修改日期。

使用示例:

假设我们的网站有三个页面:https://www.example.com/page1、https://www.example.com/page2和https://www.example.com/page3。

我们调用generate_sitemap函数,传入包含这三个页面URL的列表。该函数会生成SitemapXML文件,并将其保存为sitemap.xml。

接下来,我们可以将生成的SitemapXML文件提交给搜索引擎,以便它们可以更好地了解我们网站上的内容,并进行索引。

请注意,在实际应用中,您应该根据您的需求和网站结构来生成SitemapXML文件,其中包括其他可选的标签如<changefreq><priority>。此示例仅为了简单起见,只包含必需的标签。