Excel转成Markdown

做知识库问答系统的时候,经常遇到问题与答案是以Excel的方式整合在一起,而且会发现直接上传Exel的效果会非常不好。这时候会考虑把Excel转成Markdown,把特定的单元格选为标题,其余的单元格选为文本。

Excel转成Markdown

有一些在线的Excel转Markdown的工具,诸如Table ConvertBoost Tool ,但它们只能把表格转换成另外一个表格,并不能把某个单元转成标题,某个单元转成段落。

假如以下是Excel的内容:

Heading Text
Heading 1 This is some text related to Heading 1.
Heading 2 This is some text related to Heading 2.
Heading 3 This is some text related to Heading 3.

我们需要转换成:

## Heading 1
This is some text related to Heading 1.

## Heading 2
This is some text related to Heading 2.

## Heading 3
This is some text related to Heading 3.

这种情况虽然简单,但目前的在线工具都没相应的功能,因此需要Python的程序来实现。

你的电脑需要安装Python,顺便也安装个轻量级的开发环境Jupyter Lab。只需要运行以下的代码,显示出来的内容直接复制到Markdown便可。

import pandas as pd

# Load the Excel file
df = pd.read_excel('your_file.xlsx')

# Loop through each row and create Markdown
for index, row in df.iterrows():
    heading = row[0]
    text = row[1]
    
    print(f"## {heading}")
    print(text)
    print()  # Empty line for better readability

以上代码是GPT直接生成,有疑问可以直接问GPT。