View Code? Open in Web Editor NEW

对chatpdflike的fork 1.修改了md文件 2.修改了apikey的调用方式为代码调用不是环境调用 3.放入了一个apikey 4.介绍了出问题原因

License: Apache License 2.0

JavaScript 31.93% Python 46.70% CSS 12.55% HTML 8.82%

chatpdflike_copy's Introduction

chatpdflike

流程

来源于chatpdflike

声明：本项目并非chatpdf官方开源项目，仅是个人的复现

虽然chatpdf.com的实现代码并不开源，但是基于作者的twitter回复还是大致理顺了功能原理，主要流程原理如下：

1 、文本切割

将文本切割成一小部分，调用 openai 的 embedding 接口，返回这段文本的 embedding 的向量数据。存储这些数据，并且保存好对应关系。

2 、用户提问

将用户提的问题，调用 openai 的 embedding 接口，返回问题的向量数据。

3 、搜索向量

计算相似度,用问题的向量，在之前切割的所有向量数据里，计算和问题向量相似度最高的几个文本(余弦定理)。

4 、调用 gpt-turbo

准备合适的 prompt ，里面带上切割的文本内容，加上问题的 prompt 。

基于以上的流程，只需要开发少量的适配代码，主要功能都是由openai的接口完成，

装依赖
```
pip install -r requirements.txt
```
配置系统环境变量OPENAI_API_KEY，Ps:密钥需要自己上openai官网申请. 如果我的apikey还能跑可以用我的
```
openai.api_key ="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"
```
挂梯

这个梯需要让你能够进入openai官网,这样才能调用apikey,不然会报错.
运行
```
python run.py 
```
上传后python里面会显示Processing pdf Done processing pdf后就可以问问题,让ChatGPT帮忙读PDF了
报错原因
1. 没有等待处理完毕
  
  Pycharm终端显示Processing pdf完毕之前就直接问问题
2. 无法调用apikey
  
  没有梯子或者梯子效果不行或者没有开全局代理.可以写个测试直接进行apikey的调用,然后排除原因
3. 没有给出apikey
4. Token超载. 在Chatbot类中的def response中可以定义max_tokens为更大

Recommend Projects