Coder Social home page Coder Social logo

vector-vein's Introduction

English | 简体中文

向量脉络

🔀 向量脉络 VectorVein

利用 AI 的力量构建您的个人知识库+自动化工作流程。

无需编程,只需拖拽即可创建强大的工作流,自动化所有任务。

在线版向量脉络

向量脉络是受到 LangChain 以及 langflow 的启发而开发的无代码 AI 工作流软件,旨在结合大语言模型的强大能力并让用户通过简单的拖拽即可实现各类日常工作流的智能化和自动化。

🌐 在线体验

您可以在 这里 体验向量脉络的在线版本,无需下载安装。

官方网站 在线文档

📦 安装及配置

安装

Release 页下载 后打开 VectorVein 软件,初次打开时程序会在安装目录下创建 data 文件夹,用于存放数据库及静态文件资源。

软件采用了 pywebview 搭建,基于 webview2 内核,因此需要安装 webview2 运行时,如果出现软件无法打开,可能需要手动下载 webview2 运行时,下载地址: https://developer.microsoft.com/zh-cn/microsoft-edge/webview2/

配置

软件正常打开后点击打开设置按钮,请填入 OpenAI 的 API Key 以使用 AI 功能,并选择输出文件夹用于存放工作流输出时的文件。如果需要用到邮件发送的功能请在设置页面一并填入邮箱信息。

设置

注意事项

关于本地的 Stable Diffusion API

为了能够使用您自己本地运行的 Stable Diffusion API,您需要在 webui-user.bat 的启动项加上参数 --api,即

set COMMANDLINE_ARGS=--api

💻 使用方式

📖 基本概念

一个工作流代表了一个工作任务流程,包含了输入、输出以及工作流的触发方式。你可以任意定义输入是什么,输出是什么,以及输入是如何处理并到达输出结果的。

几个例子:

  • 翻译工作流,输入是一个英文的 Word 文档,输出也是 Word 文档,你可以设计工作流将输入的中文文档翻译后生成中文文档。
  • 思维导图工作流,如果将翻译工作流的输出改为思维导图,那么你就可以得到一个读取英文 Word 文档并总结为中文思维导图的工作流。
  • 网络文章摘要工作流,如果将思维导图工作流的输入改为网络文章的 URL,那么你就可以得到一个读取网络文章并总结为中文思维导图的工作流。
  • 客户差评自动分类工作流,输入是一个包含差评内容的表格,并自定义需要分类的关键词,即可自动将差评分类,输出就是自动生成包含分类结果的 Excel 表格。

🔎 使用界面

每个工作流都有一个使用界面和一个编辑界面,使用界面用于日常运行工作流,编辑界面用于编辑工作流。通常而言一个设计好的工作流您平时只需要在使用界面中运行即可,不需要再去编辑界面中修改。

使用界面

使用界面如上所示,分为输入、输出、触发器 ( 通常是一个运行按钮 ) 三个部分。日常使用可以直接输入内容,点击运行按钮即可在输出看到结果。

想查看运行过的工作流可以点击【工作流运行记录】,如下图所示。

工作流运行记录

✏️ 创建工作流

您可以添加我们提供的官方模板到自己的工作流中,也可以自己创建一个新的工作流。刚开始时建议先用官方模板熟悉一下工作流的使用。

工作流编辑界面

工作流编辑界面如上图所示,顶部可以编辑名称、标签以及详细描述。左侧是工作流的节点列表,右侧是工作流的画布,您可以从左侧找到想要的节点拖拽到画布中,然后通过连线连接节点,形成工作流。

您可以查看一个简易的 爬虫 + AI 总结思维导图工作流的 创建教学

还可以试一下这个 在线互动教程

🛠️ 开发部署

环境要求

  • 后端

    • Python 3.8 ~ Python 3.11
    • 安装 PDM
  • 前端

    • Vue3
    • Vite

项目开发

backend 目录下运行以下命令安装依赖:

Windows

pdm install

Mac

pdm install -G mac

正常来说 PDM 会自动找到系统的 Python 并创建虚拟环境以及安装依赖。

安装完成后运行以下命令启动后端开发服务即可看到运行效果:

pdm run dev

如果需要修改前端代码,需要在 frontend 目录下运行以下命令安装依赖:

pnpm install

前端依赖安装完成后需要将前端代码编译到后端的静态文件目录中,项目已提供了快捷指令,在 backend 目录下运行以下命令实现前端资源打包及拷贝:

pdm run build-front

软件打包

项目采用 pyinstaller 进行打包,在 backend 目录下运行以下命令即可打包成可执行文件:

pdm run build

打包完成后会在 backend/dist 目录下生成可执行文件。

📄 协议

向量脉络是一个开源的软件,支持个人非商业使用,具体协议请参考 LICENSE

vector-vein's People

Contributors

andersonby avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar

vector-vein's Issues

建议:提供一个“工作流调用"结点

每个配置好的工作流实际上就是一个小的tool. 就如你的:优化prompt。
为了提高效率,或实现更复杂的工作流,需要利用各种配置好的工作流,把这些工作流象搭积木一样,构造更加复杂或抽象的工作流。

当前可以通过写python函数结点来实现 api的调用,但对于一般的人员,有些木槛。
因此建议:
提供一个 api结点,只需要把地址填进去,把输入、输出连接定义好,就可以了。

难点:不知道输入、输出的参数个数。 这个需要自己去配置了。

添加数据报错

2023-05-27 13:17:56,788 - main_worker error: Unknown encoding cl100k_base
2023-05-27 13:17:56,788 - error_task: add_data
2023-05-27 13:17:56,788 - error_module: vector_db
2023-05-27 13:18:35,868 - vector_database receive request delete_point
2023-05-27 13:18:37,430 - vector_database receive request delete_point
2023-05-27 13:18:38,757 - vector_database receive request delete_point
2023-05-27 13:18:40,279 - vector_database receive request delete_point
2023-05-27 13:18:51,051 - worker receive task
2023-05-27 13:18:51,059 - Traceback (most recent call last):
File "worker_init_.py", line 75, in main_worker
File "worker\tasks_init_.py", line 36, in call
File "worker\tasks_init_.py", line 33, in call
File "worker\tasks_init_.py", line 15, in call
File "worker\tasks\vector_db.py", line 45, in add_data
File "utilities\text_splitter.py", line 200, in init
File "tiktoken\model.py", line 75, in encoding_for_model
File "tiktoken\registry.py", line 60, in get_encoding
ValueError: Unknown encoding cl100k_base

建议:关系数据表的操作

有时,需要基于结构化数据进行LLM 模型前的 输入准备,是否可以 在你发布的平台上,增加 类似向量数据库一样的几个构件:
1、增加数据
2、修改数据
3、删除数据
4、查找数据
当然之前,需要先建一个 数据表。

或者就 只提供一个SQL语句的构件来实现上述操作

功能建议:增加一个“列表选项"输入构件

有时,希望用户是在一系列选项中进行选择,因此希望能够预先定义好一个选项列表,供用户选。
如:
1、代码解释
2、代码纠错
3、代码试运行

在输出时,可以有两种选择:
单选或多选。

建议:支持chatglm2-6b 的调用

据说,chatglm2-6B 比chatglm-6B有较大提升。为了便于测试比较其功能,是否可以让 chatglm 构件中,可以选择 chatglm2-6B.

最新代码pdm install报错

@AndersonBY

报错信息如下

PS D:\Git项目\vector-vein\backend> pdm install -v
Lock file hash doesn't match pyproject.toml, packages may be outdated
Updating the lock file...
STATUS: Resolving dependencies
pdm.termui: ======== Start resolving requirements ========
pdm.termui:   pywebview>=4.1
pdm.termui:   httpx>=0.22.0
pdm.termui:   peewee>=3.16.2
pdm.termui:   pypdf>=3.8.1
pdm.termui:   mammoth>=1.5.1
pdm.termui:   openpyxl>=3.1.2
pdm.termui:   python-pptx>=0.6.21
pdm.termui:   openai>=0.27.0
pdm.termui:   python-docx>=0.8.11
pdm.termui:   htmldocx>=0.0.7
pdm.termui:   pandas>=2.0.1
pdm.termui:   yagmail>=0.15.293
pdm.termui:   qdrant-client>=1.1.3
pdm.termui:   markdown2>=2.4.8
pdm.termui:   tiktoken>=0.4.0
pdm.termui:   pyinstaller>=5.11.0
pdm.termui:   readability-lxml>=0.8.1
pdm.termui:   markdownify>=0.11.6
pdm.termui:   yt-dlp>=2023.3.4
pdm.termui:   pycryptodome>=3.18.0
pdm.termui:   clr-loader @ git+https://github.com/AndersonBY/clr-loader.git
pdm.termui:   python>=3.8,<3.12
pdm.termui:   Adding requirement pywebview>=4.1
pdm.termui:   Adding requirement httpx>=0.22.0
pdm.termui:   Adding requirement peewee>=3.16.2
pdm.termui:   Adding requirement pypdf>=3.8.1
pdm.termui:   Adding requirement mammoth>=1.5.1
pdm.termui:   Adding requirement openpyxl>=3.1.2
pdm.termui:   Adding requirement python-pptx>=0.6.21
pdm.termui:   Adding requirement openai>=0.27.0
pdm.termui:   Adding requirement python-docx>=0.8.11
pdm.termui:   Adding requirement htmldocx>=0.0.7
🔒 Lock failed
Unable to find a resolution for htmldocx
Please make sure the package name is correct.
Traceback (most recent call last):
  File "C:\Program Files\Python38\lib\runpy.py", line 194, in _run_module_as_main
    return _run_code(code, main_globals, None,
  File "C:\Program Files\Python38\lib\runpy.py", line 87, in _run_code
    exec(code, run_globals)
  File "c:\users\dongguodong\appdata\roaming\python\scripts\pdm.exe\__main__.py", line 7, in <module>
  File "C:\Users\dongguodong\AppData\Roaming\pdm\venv\lib\site-packages\pdm\core.py", line 289, in main
    return Core().main(args)
  File "C:\Users\dongguodong\AppData\Roaming\pdm\venv\lib\site-packages\pdm\core.py", line 207, in main
    raise cast(Exception, err).with_traceback(traceback) from None
  File "C:\Users\dongguodong\AppData\Roaming\pdm\venv\lib\site-packages\pdm\core.py", line 202, in main
    self.handle(project, options)
  File "C:\Users\dongguodong\AppData\Roaming\pdm\venv\lib\site-packages\pdm\core.py", line 157, in handle
    command.handle(project, options)
  File "C:\Users\dongguodong\AppData\Roaming\pdm\venv\lib\site-packages\pdm\cli\commands\install.py", line 84, in handle
    actions.do_lock(
  File "C:\Users\dongguodong\AppData\Roaming\pdm\venv\lib\site-packages\pdm\cli\actions.py", line 109, in do_lock
    raise ResolutionImpossible("Unable to find a resolution") from None
resolvelib.resolvers.ResolutionImpossible: Unable to find a resolution
NativeCommandExitException: Program "pdm.exe" ended with non-zero exit code: 1.

主要报错内容

Unable to find a resolution for htmldocx
Please make sure the package name is correct.

bug: 运行流程对应的 api 程序时,出错

调用api 提供的程序如下:
import json
import time

import requests

api_key = "YOUR_API_KEY"
url = "https://vectorvein.com/api/v1/open-api/workflow/run"
headers = {
"VECTORVEIN-API-KEY": api_key
}
payload = json.loads("""{
"wid": "727be329d21b45d2bf2cf63861961c4b",
"data": {
"nodes": {
"35ad4beb-1b5d-4ebc-8774-d13a27d34b5d": {
"text": "6\n"
}
}
}
}""")
response = requests.post(url, headers=headers, json=payload)
result = response.json()
print(response.status_code)
print(result)

if response.status_code != 200 or result["status"] != 200:
print("Run workflow failed!")
exit()


在 juypter 中执行时报如下错误:

JSONDecodeError Traceback (most recent call last)
c:\Users\jiangfangfang\Downloads\apitest.ipynb Cell 2 in 1
8 url = "https://vectorvein.com/api/v1/open-api/workflow/run"
9 headers = {
10 "VECTORVEIN-API-KEY": api_key
11 }
---> 12 payload = json.loads("""{
13 "wid": "727be329d21b45d2bf2cf63861961c4b",
14 "data": {
15 "nodes": {
16 "35ad4beb-1b5d-4ebc-8774-d13a27d34b5d": {
17 "text": "6\n"
18 }
19 }
20 }
21 }""")
22 response = requests.post(url, headers=headers, json=payload)
23 result = response.json()
File C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.10_3.10.3056.0_x64__qbz5n2kfra8p0\lib\json_init_.py:346, in loads(s, cls, object_hook, parse_float, parse_int, parse_constant, object_pairs_hook, **kw)
341 s = s.decode(detect_encoding(s), 'surrogatepass')
343 if (cls is None and object_hook is None and
344 parse_int is None and parse_float is None and
345 parse_constant is None and object_pairs_hook is None and not kw):
...
--> 353 obj, end = self.scan_once(s, idx)
354 except StopIteration as err:
355 raise JSONDecodeError("Expecting value", s, err.value) from None
JSONDecodeError: Invalid control character at: line 6 column 27 (char 162)

看来是
"text": "6\n" --- 这个回车“\n" 导致的。
删除这个回车符,改为:
"text": "6
运行报如下错:

JSONDecodeError Traceback (most recent call last)
File ~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\site-packages\requests\models.py:971, in Response.json(self, **kwargs)
970 try:
--> 971 return complexjson.loads(self.text, **kwargs)
972 except JSONDecodeError as e:
973 # Catch JSON-related errors and raise as requests.JSONDecodeError
974 # This aliases json.JSONDecodeError and simplejson.JSONDecodeError
File C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.10_3.10.3056.0_x64__qbz5n2kfra8p0\lib\json_init_.py:346, in loads(s, cls, object_hook, parse_float, parse_int, parse_constant, object_pairs_hook, **kw)
343 if (cls is None and object_hook is None and
344 parse_int is None and parse_float is None and
345 parse_constant is None and object_pairs_hook is None and not kw):
--> 346 return _default_decoder.decode(s)
347 if cls is None:
File C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.10_3.10.3056.0_x64__qbz5n2kfra8p0\lib\json\decoder.py:337, in JSONDecoder.decode(self, s, _w)
333 """Return the Python representation of s (a str instance
334 containing a JSON document).
335
336 """
--> 337 obj, end = self.raw_decode(s, idx=_w(s, 0).end())
338 end = _w(s, end).end()
File C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.10_3.10.3056.0_x64__qbz5n2kfra8p0\lib\json\decoder.py:355, in JSONDecoder.raw_decode(self, s, idx)
...
973 # Catch JSON-related errors and raise as requests.JSONDecodeError
974 # This aliases json.JSONDecodeError and simplejson.JSONDecodeError
--> 975 raise RequestsJSONDecodeError(e.msg, e.doc, e.pos)
JSONDecodeError: Expecting value: line 2 column 1 (char 1)

咨询

大佬好,我看工作流模板没有与你的在线版上的同步,是否以后会同步?另外浏览器插件是否能够支持本地的开源版本?

最新版本(Sep 23) 启动后端开发服务报错

报错信息

g******n@guancandeAir backend % pdm run dev
2023-10-12 16:32:30,341 - unable to open database file
2023-10-12 16:32:30,341 - Proxies: {}
2023-10-12 16:32:30,342 - unable to open database file
2023-10-12 16:32:30,342 - Proxies for requests: {}
Traceback (most recent call last):
File "/Users/guancan/Documents/GitHub/vector-vein/backend/main.py", line 29, in
from worker import main_worker, main_vector_database
File "/Users/guancan/Documents/GitHub/vector-vein/backend/worker/init.py", line 13, in
from worker.tasks import (
File "/Users/guancan/Documents/GitHub/vector-vein/backend/worker/tasks/output.py", line 14, in
from htmldocx import HtmlToDocx
File "/Users/guancan/Documents/GitHub/vector-vein/backend/.venv/lib/python3.9/site-packages/htmldocx/init.py", line 1, in
from .h2d import HtmlToDocx
File "/Users/guancan/Documents/GitHub/vector-vein/backend/.venv/lib/python3.9/site-packages/htmldocx/h2d.py", line 25, in
from docx.oxml import OxmlElement
ImportError: cannot import name 'OxmlElement' from 'docx.oxml' (/Users/guancan/Documents/GitHub/vector-vein/backend/.venv/lib/python3.9/site-packages/docx/oxml/init.py)

解决尝试

尝试删除并重新拉取代码、重装 python-docx 包等方法,木有解决问题

建议提供docker部署能力

我macOS,项目克隆下来之后,执行pdm install命令报错:

Unable to find a resolution for pyinstaller
Please make sure the package name is correct.
Traceback (most recent call last):
File "/opt/homebrew/bin/pdm", line 8, in
sys.exit(main())
File "/opt/homebrew/Cellar/pdm/1.15.3/libexec/lib/python3.10/site-packages/pdm/core.py", line 232, in main
return Core().main(args)
File "/opt/homebrew/Cellar/pdm/1.15.3/libexec/lib/python3.10/site-packages/pdm/core.py", line 167, in main
raise cast(Exception, err).with_traceback(traceback)
File "/opt/homebrew/Cellar/pdm/1.15.3/libexec/lib/python3.10/site-packages/pdm/core.py", line 162, in main
f(options.project, options)
File "/opt/homebrew/Cellar/pdm/1.15.3/libexec/lib/python3.10/site-packages/pdm/cli/commands/install.py", line 48, in handle
actions.do_lock(project, strategy=strategy, dry_run=options.dry_run)
File "/opt/homebrew/Cellar/pdm/1.15.3/libexec/lib/python3.10/site-packages/pdm/cli/actions.py", line 114, in do_lock
raise ResolutionImpossible("Unable to find a resolution") from None
resolvelib.resolvers.ResolutionImpossible: Unable to find a resolution

已经折腾了半天了,目前问题仍然无法解决,第一步的环境问题就卡主了,建议提供docker部署能力,避免让大家折腾环境问题。

获取工作流失败

问题说明

  1. 打开官方工作流模板界面,然后选择任意语言文章总结生成中文思维导图工作流,提示获取工作流失败

功能建议:自己分享的模板,可以删除

发现自己分享的模板已过时,想更新一版,但旧的无法删除,且分享过后,就与原有模板分开了。因此想要更新,就需要再去修改它。
为了省事,就新发布一个,导致有些重复了。且容易造成困惑。
建议:
1、可以删除分享的模板;
2、或者与自己那个原始模板保持关连,联动。

建议:实现Agent的构件

我理解,当前工作流类似于langchain中的 chain对象,可以完成一些 目标具体的操作性任务。未来更广泛的应用领域,可能是AI agent. 不知有没有可能在这里 提供 agent 及 agent executor的 控制或对象。
类似这个开源项目实现的架构:
https://github.com/filip-michalsky/SalesGPT

我也理解,当前的应用框架是针对工作流的,可能不太容易实现 “多次交互式”的能力,也许也没有必要去集成这个能力。
一个可能的解决方案 在别的框架中,调用这里定制的工作流即可。 仅供参考。

建议:工具--文本搜索 构件的输出字数控制

问题;在通过搜索获取相关信息,合并成一个本文,然后要输出给 chatGLM 时,有时会由于输出的数据量过大,导致 token超出了,引起错误。
建议:在 文本搜索 构件输出时,是否可能增加一个“字数”控制。

对于 文本爬虫 是不是也有这样需求,控制输出的最大字数。

当然,也许只需要 在 chatGLM输入时,截取自己能够处理的最大token数量,就能解决这个问题。

中文路径报错问题,0.0.6版本仍然报错

情况说明

之前06.03的时候打开0.0.4没问题,刚刚下载了0.0.5打开报错,然后再打开0.0.4报错,跟0.0.5报错内容一致,两个版本的文件分别存在不同名称的文件夹里

报错截图如下

微信截图_20230605092340

报错信息如下

Traceback (most recent call last):
  File "main.py", line 102, in <module>
  File "webview\__init__.py", line 132, in start
  File "webview\guilib.py", line 101, in initialize
  File "webview\guilib.py", line 62, in try_import
  File "webview\guilib.py", line 52, in import_winforms
  File "<frozen importlib._bootstrap>", line 991, in _find_and_load
  File "<frozen importlib._bootstrap>", line 975, in _find_and_load_unlocked
  File "<frozen importlib._bootstrap>", line 671, in _load_unlocked
  File "PyInstaller\loader\pyimod02_importers.py", line 352, in exec_module
  File "webview\platforms\winforms.py", line 27, in <module>
  File "<frozen importlib._bootstrap>", line 991, in _find_and_load
  File "<frozen importlib._bootstrap>", line 975, in _find_and_load_unlocked
  File "<frozen importlib._bootstrap>", line 671, in _load_unlocked
  File "PyInstaller\loader\pyimod02_importers.py", line 352, in exec_module
  File "clr.py", line 6, in <module>
  File "pythonnet\__init__.py", line 143, in load
  File "clr_loader\types.py", line 64, in __call__
RuntimeError: cannot call null pointer pointer from cdata 'int(*)(void *, int)'

pdm install报错

D:\myProjects\vector-vein-main\backend>pdm install -v
STATUS: Resolving packages from lockfile...
STATUS: Fetching hashes for resolved packages...
Synchronizing working set with lock file: 57 to add, 25 to update, 0 to remove

pdm.termui: Removing distribution setuptools
pdm.termui: Error occurred during uninstallation, roll back the changes now.
pdm.termui: Can't rollback, not uninstalled yet
✖ Update setuptools 65.6.3 -> 68.1.2 failed
Traceback (most recent call last):
File "D:\anaconda3\lib\runpy.py", line 196, in _run_module_as_main
return _run_code(code, main_globals, None,
File "D:\anaconda3\lib\runpy.py", line 86, in run_code
exec(code, run_globals)
File "c:\users\13328.local\bin\pdm.exe_main
.py", line 7, in
File "C:\Users\13328.local\pipx\venvs\pdm\lib\site-packages\pdm\core.py", line 290, in main
return Core().main(args or sys.argv[1:])
File "C:\Users\13328.local\pipx\venvs\pdm\lib\site-packages\pdm\core.py", line 208, in main
raise cast(Exception, err).with_traceback(traceback) from None
File "C:\Users\13328.local\pipx\venvs\pdm\lib\site-packages\pdm\core.py", line 203, in main
self.handle(project, options)
File "C:\Users\13328.local\pipx\venvs\pdm\lib\site-packages\pdm\core.py", line 157, in handle
command.handle(project, options)
File "C:\Users\13328.local\pipx\venvs\pdm\lib\site-packages\pdm\cli\commands\install.py", line 95, in handle
actions.do_sync(
File "C:\Users\13328.local\pipx\venvs\pdm\lib\site-packages\pdm\cli\actions.py", line 213, in do_sync
synchronizer.synchronize()
File "C:\Users\13328.local\pipx\venvs\pdm\lib\site-packages\pdm\installers\synchronizers.py", line 433, in synchronize
handlers[kind](key, progress)
File "C:\Users\13328.local\pipx\venvs\pdm\lib\site-packages\pdm\installers\synchronizers.py", line 303, in update_candidate
self.manager.uninstall(dist)
File "C:\Users\13328.local\pipx\venvs\pdm\lib\site-packages\pdm\installers\manager.py", line 50, in uninstall
raise UninstallError(e) from e
pdm.exceptions.UninstallError: [WinError 5] 拒绝访问。: 'd:\anaconda3\lib\site-packages\_distutils_hack\override.py'

建议:提取PDF中图片中的文字信息或者是数据表格

现在的读文件结点是可以读取PDF中的文字信息信息的。但经常会遇到PDF中实际上是图片,图片里面有许多文字与数据。
不知有没什么网站的服务或者是程序包,可以把PDF中的图片中的文字或数据信息提取出来。
若有,建议:
增加一个结点,提取PDF中的信息(含图片)

功能建议:python函数的界面输出作为构件的输出

现在可以调用python程序,但只能接受python的返回值。不能有print语句,不能有画图语句。
由于想利用生成的python进行数据分析,因此,会希望python程序基于给定的数据画出图表,如柱状图,折线图。
因此希望能够提供 把 python函数的 界面输出,作为构件的输出的功能。

报错:软件打包后,执行报错:no module name 'webview"

在pdm run build后,执行dist 目录下的 VectorVein.exe 命令后,报如下错误。

image

这是dist/vector-vein目录下的文件列表:
目录: D:\vector-vein-dev\vector-vein\backend\dist\vector-vein

Mode LastWriteTime Length Name


d----- 2023/6/17 20:45 web
-a---- 2023/6/17 20:45 1847603 base_library.zip
-a---- 2023/6/7 6:02 3445016 libcrypto-1_1.dll
-a---- 2023/6/7 6:02 704792 libssl-1_1.dll
-a---- 2023/6/7 6:01 5762840 python311.dll
-a---- 2023/6/7 6:01 30480 select.pyd
-a---- 2023/6/7 6:01 1141016 unicodedata.pyd
-a---- 2023/6/7 6:02 109392 VCRUNTIME140.dll
-a---- 2023/6/17 20:45 2015004 VectorVein.exe
-a---- 2023/6/17 20:45 5 version.txt
-a---- 2023/6/7 6:01 84760 _bz2.pyd
-a---- 2023/6/7 6:01 253200 _decimal.pyd
-a---- 2023/6/7 6:01 65304 _hashlib.pyd
-a---- 2023/6/7 6:01 158992 _lzma.pyd
-a---- 2023/6/7 6:01 32528 _queue.pyd
-a---- 2023/6/7 6:01 79640 _socket.pyd
-a---- 2023/6/7 6:01 161040 _ssl.pyd
-a---- 2023/6/7 6:01 25360 _uuid.pyd

确实没有 webview目录。不知是不是安装 webview2的问题。

我下载你提供的安装版本,能够正常启动,且在下面发现有 webview目录,如下所示:
image

pdm run dev 页面空白

控制台报错信息如下,应该是返回的js文件 mimeType指定错误

Failed to load module script: Expected a JavaScript module script but the server responded with a MIME type of "text/plain". Strict MIME type checking is enforced for module scripts per HTML spec.

image

image

今日最新版pdm run dev报错

操作步骤

  1. 拉取代码https://github.com/AndersonBY/vector-vein.git
  2. cd backend
  3. pdm install
  4. pdm run dev

报错信息

PS D:\git\vector-vein\backend> pdm run dev
2023-08-25 09:54:54,393 - unable to open database file
2023-08-25 09:54:54,393 - Proxies: {}
2023-08-25 09:54:54,393 - unable to open database file
2023-08-25 09:54:54,393 - Proxies for requests: {}
Traceback (most recent call last):
  File "main.py", line 29, in <module>
    from worker import main_worker, main_vector_database
  File "D:\git\vector-vein\backend\worker\__init__.py", line 10, in <module>
    from utilities.workflow import Workflow
  File "D:\git\vector-vein\backend\utilities\workflow.py", line 111, in <module>
    class Workflow:
  File "D:\git\vector-vein\backend\utilities\workflow.py", line 146, in Workflow
    def handle_workflow_invoke(self, node_obj: Node) -> list[dict]:
TypeError: 'type' object is not subscriptable
NativeCommandExitException: Program "pdm.exe" ended with non-zero exit code: 1.

其他

pdm run build 在未删除文件夹重新down一份代码时报错如下:

PS D:\git\vector-vein\backend> pdm run build
Fatal error in launcher:

整个文件夹删除重新搞的时候是没问题的,不知道什么原因

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.