Excel转成Markdown
做知识库问答系统的时候,经常遇到问题与答案是以Excel的方式整合在一起,而且会发现直接上传Exel的效果会非常不好。这时候会考虑把Excel转成Markdown,把特定的单元格选为标题,其余的单元格选为文本。
有一些在线的Excel转Markdown的工具,诸如Table Convert、Boost Tool ,但它们只能把表格转换成另外一个表格,并不能把某个单元转成标题,某个单元转成段落。
假如以下是Excel的内容:
Heading | Text |
---|---|
Heading 1 | This is some text related to Heading 1. |
Heading 2 | This is some text related to Heading 2. |
Heading 3 | This is some text related to Heading 3. |
我们需要转换成:
## Heading 1
This is some text related to Heading 1.
## Heading 2
This is some text related to Heading 2.
## Heading 3
This is some text related to Heading 3.
这种情况虽然简单,但目前的在线工具都没相应的功能,因此需要Python的程序来实现。
你的电脑需要安装Python,顺便也安装个轻量级的开发环境Jupyter Lab。只需要运行以下的代码,显示出来的内容直接复制到Markdown便可。
import pandas as pd
# Load the Excel file
df = pd.read_excel('your_file.xlsx')
# Loop through each row and create Markdown
for index, row in df.iterrows():
heading = row[0]
text = row[1]
print(f"## {heading}")
print(text)
print() # Empty line for better readability
以上代码是GPT直接生成,有疑问可以直接问GPT。