Blog – 第 2 页 – 一粒云

解锁企业智慧：构建高效知识管理系统的终极指南

2024 年 12 月 12 日由admin发布在云办公、文档云、知识图谱、管理知识在上留下评论

在数字化信息时代，企业知识管理系统的构建已成为提升竞争力的关键。随着信息量爆炸式增长，企业面临“信息过载”问题，知识点孤立和冗余内容常导致工作效率下降。因此，企业需要建立系统化的知识管理体系，实现知识共享、显性化、体系化与再生化。

知识共享化：打破信息壁垒

隐性知识大多存在于员工头脑中，难以规范化。通过自上而下的管理传递、员工分享激励和横向沟通，企业可有效推动知识共享，避免“沉默的螺旋”和“信息茧房”现象。管理者需通过激励机制、匿名反馈和互动平台，激发员工的分享欲望，营造开放的学习环境。

知识显性化：知识内容清晰易懂

将隐性知识转化为文档、视频等易于理解和传播的形式。提高知识显性化水平，需要使用清晰的语言、结构化内容与操作指南，避免“知识的诅咒”，确保员工能够快速学习与应用。

知识体系化：建立有序知识目录

通过明确的知识分类与目录结构，解决信息碎片化和“信息过载”问题。构建企业知识目录时，需根据业务角色、职能划分和应用场景细分内容，形成关联明确、层次清晰的知识网络，提升员工的信息检索与学习效率。

知识再生化：激发持续创新

知识的应用与再创造是企业竞争力的源泉。通过精准检索、实践操作和创新激励机制，企业可引导员工不断学习、应用与改进已有知识，实现知识资产的持续增值。

要实现企业知识管理的四个阶段：知识显性化、知识共享化、知识体系化和知识再生化，推荐以下工具组合，涵盖文档管理、协作平台和学习系统：

1. 知识显性化（Externalization）工具

将隐性知识转化为文档、视频等形式：

文档与内容管理系统（DMS）：如 Microsoft SharePoint、Google Workspace、Notion
视频与演示工具：如 Loom、Camtasia、PowerPoint、Prezi
流程与知识捕获工具：如 Miro（思维导图）、Lucidchart（流程图）

2. 知识共享化（Socialization）工具

实现跨团队知识共享与互动：

企业社交平台与协作工具：如 Microsoft Teams、Slack、Workplace by Meta
知识问答与社区平台：如 Confluence、Yammer、Discourse
内部交流与公告平台：如 Trello、Monday.com（任务与信息公告）

3. 知识体系化（Combination）工具

组织知识、构建有序知识库：

知识库与文档管理系统：如 Atlassian Confluence、Notion、Guru
搜索与文档索引工具：如 Elasticsearch、Google Cloud Search、SharePoint Search
内容管理与版本控制系统：如 GitHub（适用于技术文档和代码管理）

4. 知识再生化（Internalization）工具

学习平台与持续培训：

学习管理系统（LMS）：如 Moodle、TalentLMS、SAP SuccessFactors
在线课程与内容平台：如 Udemy for Business、Coursera for Teams
反馈与测评系统：如 SurveyMonkey、Typeform、Google Forms

集成与自动化工具（增强整体效率）

自动化工具：如 Zapier、Make（Integromat），将不同系统的数据与任务自动化。
企业资源规划（ERP）系统：如 SAP ERP、Oracle NetSuite，用于集成广泛业务功能。

为什么需要企业知识目录？

2024 年 12 月 12 日由admin发布在云办公、文档云、知识图谱在上留下评论

在信息化时代，知识型企业面临的一个重大挑战是“信息过载”，即员工面对大量未整理的文档和数据，难以有效筛选和运用。这种现象常导致学习低效和决策失误。因此，构建一个清晰的企业知识目录至关重要。以下是企业主如何建设企业知识目录的详细指南。

一、为什么需要企业知识目录？

1. 避免信息过载

减少干扰：有效的知识目录能过滤冗余信息，帮助员工专注于有用数据。
增强思维连接：知识目录能帮助员工更好地理解和记忆新知识，形成清晰的思维框架。

2. 提高学习与决策效率

顺藤摸瓜：学习内容按照逻辑结构层层展开，便于知识迁移与应用。
快速定位信息：通过结构化目录，员工能快速找到所需资料，避免重复查找。

二、构建企业知识目录的核心步骤

1. 知识梳理与分类

领域划分：将企业知识按适用角色、业务职能、项目阶段等维度划分。
主题细化：细分大类，形成多个子类别。例如，”政策文件”可细分为”申报要求”、”评审标准”等。

2. 知识点关联与结构化

建立层级目录：
从“是什么”开始，再到“为什么”、“如何做”等层次，形成完整的知识链。
确保目录逻辑清晰，避免孤立的知识点。
交叉关联：
创建知识点之间的引用与链接，例如将“项目管理”与“风险控制”相关内容相互引用。

3. 知识标签与检索优化

标签体系设计：
基于文档的主题、日期、作者等元数据生成标签，便于检索与筛选。
搜索引擎集成：
引入语义搜索和智能推荐，确保快速、精准的信息定位。

三、企业网盘知识目录架构设计示例

以下是一个适用于企业网盘的知识目录架构设计示例：

根目录：企业知识库

1. 公司政策与规章制度

人事政策
财务管理
数据安全与合规

2. 项目管理与运营

项目文档
项目计划
项目报告
风险管理
运营流程与标准

3. 产品与服务支持

产品手册
技术支持文档
常见问题与解决方案

4. 客户与市场资料

客户档案
市场调研报告
销售数据与分析

5. 培训与学习资源

内部培训材料
员工技能发展课程
行业学习资料

权限与安全控制示例：

权限管理：基于用户角色分配访问权限。
数据备份与恢复：设置自动备份，确保数据安全。
使用审计与日志记录：监控访问行为，确保合规性。

通过构建系统化的企业知识目录，企业主不仅能有效应对“信息过载”挑战，还能激发员工的学习主动性，提升工作效率与决策质量，实现知识资产的最大化利用。

一粒云协同文档云系统：守护企业数据安全，防止勒索病毒侵袭

2024 年 12 月 9 日由admin发布在客户案例、行业方案在上留下评论

在如今这个信息化的时代，数据对于企业的重要性不言而喻。企业数据不仅是经营决策的依据，也是团队协作的核心。然而，随着勒索病毒的肆虐，越来越多企业面临数据被加密、勒索威胁的困境，企业的运营和发展也因此受到极大威胁。那么，如何有效地防止勒索病毒的侵害呢？一粒云企业网盘系统，为您提供了强大的数据保护能力，让您的企业数据安全无忧。

1. 防止勒索病毒的“第一道屏障”

勒索病毒之所以如此危险，主要依赖于企业网络中的共享端口和传输协议来传播。传统的文件共享方式往往通过SMB（Server Message Block）协议来传输数据，这也成为勒索病毒的传播途径之一。然而，一粒云企业网盘系统避免了这一隐患，它完全没有开启Samba的共享端口，所有的数据传输都采用安全的HTTP或HTTPS协议。通过这种方式，企业内部的每一位员工数据都可以通过独立的客户端进行备份和共享，确保数据传输的安全性，最大限度地降低了勒索病毒通过网络传播的风险。

2. 分布式存储，确保文件安全

勒索病毒往往通过加密文件的后缀来进行勒索，从而威胁企业数据的完整性和可用性。然而，一粒云企业网盘系统采用了先进的分布式存储技术。每个文件被分散存储在多个节点上，文件的后缀通常并不会成为勒索病毒的攻击目标。即使勒索病毒试图加密或篡改某些文件，也无法轻易对系统中的文件造成破坏。分布式存储不仅提升了数据的可靠性，还有效避免了勒索病毒的威胁。

3. 独立的备份与快照机制，轻松恢复数据

即便是再强大的防护措施，也无法百分之百避免所有的勒索病毒攻击。针对这一点，一粒云企业网盘系统还引入了独立的文件备份与数据库快照机制。系统会定期为文件和数据库创建快照，保存最近30天内的所有数据版本。这意味着，即使企业在某个时刻遭遇勒索病毒攻击，数据也能通过快照机制迅速回滚，恢复到最近的正常状态。这样，企业不仅能够避免因勒索病毒攻击而导致的巨大损失，还能够实现快速的数据恢复，保障业务持续稳定运营。

案例说明：深圳某创新科技公司，四年内两次遭遇勒索病毒，均成功恢复

让我们来看一个真实的案例。深圳某创新科技公司在过去四年内，曾两次遭遇勒索病毒的攻击，每次都造成了不同程度的数据损失。然而，幸运的是，这家公司使用了一粒云协同文档云系统。每次病毒攻击发生后，企业都能通过一粒云的备份和快照机制，迅速恢复丢失的数据，确保了企业运营不受影响。可以说，正是因为一粒云系统强大的数据保护能力，该公司成功避免了勒索病毒带来的灾难性后果。

一粒云，保护数据安全，提高协同效率

对于现代企业来说，数据的安全性至关重要。面对日益猖獗的勒索病毒，一粒云企业网盘系统凭借其创新的技术优势，提供了全面的防护措施，帮助企业有效避免勒索病毒的侵袭。不仅如此，系统强大的备份与恢复功能，也让企业在面对数据丢失时能够迅速恢复，保障了业务的持续性和稳定性。

选择一粒云，选择企业数据的安全守护，又是协同的助手。让我们一起迎接更加安全、更加高效的未来！

PDF 内容提取对比Pymupdf4llm 和 pdf-extract-api

2024 年 12 月 9 日由admin发布在AI智能、数据增强在上留下评论

下面是对比 Pymupdf4llm 和 pdf-extract-api 两种工具在多个维度上的分析：

1. 工具介绍

• Pymupdf4llm

是基于 PyMuPDF 的轻量级库，用于解析 PDF 文档并将其输出为适合 LLM 使用的格式。主要侧重文本提取和结构化处理，适合生成上下文良好的段落，便于用于 LLM 的问答场景。

• pdf-extract-api

是一个基于 API 的工具，专注于从 PDF 中提取特定的数据（如表格、元数据、关键段落等）。它通常提供更精细的配置选项，且需要在线服务支持。

2. 优点

Pymupdf4llm

• 开源和轻量化：基于 PyMuPDF，依赖简单，不需要网络请求。

• 灵活性：支持本地化部署和定制，适合对隐私敏感的数据处理。

• LLM优化：文本提取经过优化，更适合直接喂给 LLM 使用。

• 社区支持：有 Python 社区的广泛支持，文档丰富。

pdf-extract-api

• 精确提取：通过 API 提供强大的功能，如识别表格、图像提取以及结构化内容分离。

• 便捷性：通常不需要用户过多了解 PDF 内部结构，适合快速实现提取目标。

• 扩展性：可与其他 API 组合实现复杂任务，如 OCR 集成处理扫描 PDF。

3. 缺点

Pymupdf4llm

• 复杂性有限：对非常复杂的 PDF（如多层嵌套、表格、图片）支持不如专业化工具。

• 手动调整需求高：对提取后的数据，需要编写代码进一步清洗和整理。

pdf-extract-api

• 依赖在线服务：需要网络访问，可能对敏感文档不适合。

• 成本问题：通常是收费服务，使用量大时费用可能较高。

• 上手门槛高：需要了解 API 调用的基础，复杂设置可能增加学习成本。

4. 准备度与上手难度

指标 Pymupdf4llm pdf-extract-api

部署与安装 安装简单（pip install pymupdf 等）需要注册 API 服务并配置访问权限

学习曲线 易于上手，Python 开发者友好需要熟悉 API 文档，配置参数稍复杂

定制化能力 高，代码灵活，自由控制输出内容和格式中，定制需依赖 API 提供的接口和选项

速度本地运行，速度快 API 请求受网络和服务端性能影响

环境依赖 本地运行，无需联网需联网使用在线 API 服务

总结与建议

• 选择 Pymupdf4llm：

如果你希望完全掌控 PDF 的提取逻辑、对敏感数据有隐私保护需求，并倾向于本地化轻量部署，Pymupdf4llm 是不错的选择。

• 选择 pdf-extract-api：

如果需要快速处理复杂的 PDF 任务（如表格解析、精确提取特定内容），且不介意使用在线服务和支付一定费用，那么 pdf-extract-api 更加适合。

最终选择取决于项目的复杂性、隐私要求和开发资源。

企业核心技术泄露风险日益严重，如何守住“致命”商业秘密？

2024 年 12 月 8 日2024 年 12 月 9 日由admin发布在产品与研发、客户案例、隔离网安全在上留下评论

一粒云KWS隔离网文件安全交换系统助力企业防止数据泄露

近日，高德红外因六名前员工涉嫌盗用公司核心技术，向法院提起了商业秘密侵权诉讼，索赔金额高达2亿元人民币。这一案件不仅让高德红外付出了巨大的经济代价，更警示了所有研发型企业——如何防止企业核心技术和商业秘密的泄露，已经成为了企业面临的一项重要挑战。

企业的研发数据、生产技术、设计图纸等商业秘密一旦泄露，不仅可能导致经济损失，还可能让竞争对手迅速获得市场优势。在这种背景下，研发型企业必须加强对核心技术的保护，采取先进的数据交换与文件管理技术，防止信息泄露和不法获取。

高德红外事件暴露企业数据安全管理的隐患

高德红外的案例并非个别现象。随着信息技术的飞速发展，企业内外网隔离的需求不断增加，但随之而来的问题也越来越明显——文件交换和数据传输的安全性成为了难题。传统的U盘、移动硬盘等手动数据交换方式存在多种风险，包括：

数据丢失或损坏：U盘和移动硬盘易损坏，数据可能丢失。
病毒感染：存储设备易受病毒攻击，威胁企业网络安全。
缺乏审计和权限控制：无法精确记录文件的传输路径，无法追溯数据流转历史。

更严重的是，在员工离职时，技术泄露的风险大大增加。对于企业来说，如何在内外网隔离的环境下，高效、安全地传输核心文件，已成为企业管理中的重要问题。

一粒云KWS隔离网文件安全交换系统：为企业核心技术保驾护航

为了解决这一问题，一粒云KWS隔离网文件安全交换系统应运而生。该系统通过跨网安全摆渡技术，帮助企业实现内外网、多个安全域之间的安全文件流转，确保敏感数据在传输过程中不会泄露。

核心功能：

内外网隔离与文件安全交换：通过网闸技术实现内外网的物理隔离和安全交换，文件在交换过程中自动进行病毒查杀、敏感词过滤和数据加密。
智能审批与权限控制：文件交换前，需通过多级审批，确保只有授权人员才能访问和处理敏感数据。同时，系统支持动态权限管理，防止未授权人员获取机密信息。
实时审计与日志记录：系统自动记录所有文件交换的操作日志，所有文件操作都可追溯，确保万无一失，防止数据泄漏。
安全流转与加密存储：文件在流转过程中进行加密存储，确保即使数据被盗取，也无法被解读。

一粒云KWS隔离网文件安全交换系统，已经在多个行业和企业中得到了成功应用，为他们提供了全方位的数据安全保障。

企业应用案例：一粒云KWS系统助力多个行业数据安全

河北大唐电力：河北大唐电力使用一粒云KWS系统实现了跨区域、跨网络的文件安全传输，确保了各电力生产基地间的数据流转和工程文件交换不受外部攻击威胁。该系统的多节点模式使得各分公司间的数据交换更加高效和安全。
甘肃大唐电力：甘肃大唐电力通过一粒云系统解决了内部办公网与外部供应商、合作伙伴之间的文件流转问题。系统的审批机制确保了所有文件的外发都经过严格审查，有效避免了商业秘密泄露的风险。
宏工科技：宏工科技是一个高端设备制造商，涉及大量技术研发和产品设计文件。采用一粒云KWS系统后，公司成功地实现了研发数据和生产工艺文件的跨网安全传输，并且所有的文件传输过程都有详细的审计记录，确保商业秘密的安全。
金山机器人：金山机器人采用一粒云KWS系统来管理生产数据和技术文档的交换。通过系统的病毒查杀和敏感词过滤功能，确保了所有设计图纸、生产流程文档在流转过程中的绝对安全，防止了技术资料的非法外泄。
信宇人股份：信宇人股份是一家集研发和生产为一体的高科技企业，通过一粒云KWS系统实现了内外网之间的安全文件交换，成功避免了技术数据外泄的风险。系统的加密存储和文件审批功能，确保了每一份文件在传输过程中都得到充分保护。

早做准备，杜绝高风险事件发生

高德红外的商业秘密侵权事件再次提醒企业，尤其是那些拥有大量核心技术和敏感数据的研发型企业，在日益复杂的网络环境中，必须做好充足的防护措施。仅仅依赖传统的安全策略和手动数据传输方式，远远不足以应对日益严峻的数据泄露风险。

企业应尽早部署像一粒云KWS隔离网文件安全交换系统这样的高效安全解决方案，实现内外网隔离下的数据传输和文件流转，确保商业秘密不外泄，保护企业的技术创新和核心竞争力。

一粒云KWS隔离网文件安全交换系统不仅能够为企业提供高效、安全的跨网文件交换解决方案，还能通过智能审批、敏感词过滤、日志审计等多重功能，确保核心技术和商业秘密在流转过程中的绝对安全。随着数据泄露风险的加剧，企业必须早做准备，采取先进的数据交换与管理技术，为核心技术和商业秘密保驾护航。

防患于未然，选择一粒云，选择更安全的未来。

多区域文件安全隔离交换实战案例分析1

2024 年 11 月 29 日2024 年 11 月 29 日由admin发布在行业方案、隔离网安全在上留下评论

以下是来自某个客户诉求：

客户为大型企业，采用4个区域隔离的方式形成统一的文档架构。【】里面的内容为一粒云 KWS所支持的功能，可以看到我们基本全部满足的客户的要求，除了定制功能以外。

支持单节点多区域（多空间）部署模式，在不同区域登陆时，仅支持读取当前区域内的访问空间，禁止读取其它区域的内容，防止造成文件传输失控。【支持】

人员组织信息通过我方的人员信息组织平台同步，需要文档摆渡系统这边开放API接口，我们这边做对接。【支持，免费提供API】

同步的人员信息不包含账户信息，无用户密码，需要做一个账户初次登陆的验证（验证形式可以云之家APP扫码、短信、邮箱等，形式不限），用户自己设置新密码，同时可以与组织架构的用户本人关联上。【单点登录，支持Oauth2.0】

与ERP平台的项目信息同步，ERP平台已开放对应的API接口，需要文档摆渡平台主动抓取相关信息，并用于审批流中。【定制开发】

审批流的需要满足两种维度的支持，一种是依据组织架构的层级进行审批，一种是依据项目维度管理的流程审批，除了申请人的上级需要进行审批外，还需要项目负责人进行审批。【支持】

需要支持多层级的压缩包穿透检测。【支持】

需要支持真实文件的检测，识别被改的后缀文件的真实文件格式，可以对未知格式、加密压缩包、无后缀文件进行判断。【支持】

DLP审查需要支持常规格式类型文档的敏感信息检查，至少要满足文本文件检查，有ORC识别、AI学习等功能更好【支持，需要额外购买 AI检测模块，支持语意、图片说明】

可根据文档格式、DLP、病毒的检查结果，匹配对应的审批流程，可实现直接放行、正常审批、增加审批节点、拒绝、通知相关人员等【流程配置，看需求应该需要定制一些地方】。

需支持被亿赛通加密的文件进行DLP、病毒检查，我方可以配合进行加密策略的调整，需要实现加密文件可以被DLP及病毒软件扫描，在线可预览，同时确保被传递的文件再下载时处于密文状态。【支持，定制开发在线预览、调用接口可以完成】

11、在线预览要有水印功能，可追溯因截屏拍照导致的文件泄露事件。【支持】

12、通知消息需要与云之家APP做集成，通知流程审批节点。【定制对接，推送审批】

13、云之家APP做单点登陆集成，支持在云之家APP端进行流程审批。【定制，对接审批流程模板，绑定到隔离网文件交换的审批流程】

14、支持审批表单的自定义。【支持、目前支持输入、选择2种字段、其他的需要定制】

15、支持审批人在PC和手机端在线预览文件，但不能下载文件。（该功能可根据实际需求进行关闭和开启）【支持】

16、支持准入功能，非授信的设备无法登陆平台，或者至少无法下载文件。（其目的是为了防止加密的文件通过平台进行明文下载，造成加密失控，如果通过其它方式可以确保是密文下载【指定类型文件】，可不用支持准入）【支持，可以绑定设备登录，非认证设备无法登录】

17、支持完整的流程日志查询和审计，便于事件追溯和排查。【支持】

针对这个客户，我们出具大简洁方案为：

对接1：单点登录【1周】

对接2：账号组织架构同步【2周】

对接3：对接亿赛通加解密、加密、解密、检查文档加密状态【2周】

对接4: DLP 内容检测后的的流程对接（这里建议绑定 AI内容检测与我们的文档安全登分级模块，根据检测后的等级进去走对应的流程）【2周】

对接5：自定义审批表单对接或者定制。【1周】

模块：隔离网文件安全交换审计模块

系统节点：4个，每个区域一个，提供文档管理、企业网盘、分布式存储、文件预览、权限管理、安全上传、敏感内容识别等功能。

使用用户：1200人

教育网盘能解决学校的哪些问题？

2024 年 11 月 29 日由admin发布在产品与研发、行业方案在上留下评论

教育网盘文档管理系统在学校中可以在多个场景帮助老师、学科组长和学校领导解决具体的管理和协作问题。以下是几个典型的应用场景及其解决的具体问题：

1. 教师之间的协作和资源共享

场景： 多个教师需要共享教学资源、教案、课件、试题库等。

问题： 教师之间资源共享不便，文件管理杂乱，版本混乱，导致重复劳动。
解决方案： 企业网盘可以为教师提供一个统一的文件存储和管理平台，教师可以将教学资源上传到云端，设置共享权限，确保所有教师都能访问、编辑和更新最新的教学资料。
功能： 文件版本管理、权限设置、协作编辑、搜索功能等，方便资源的快速查找与更新。

2. 学科组长的教学资源整合和管理

场景： 学科组长需要协调并管理本学科所有教师的教学资料，保证教学质量。

问题： 文件管理分散、教师上传的文件格式不一致、版本不统一，难以协调和评审。
解决方案： 学科组长可以通过网盘对各类教学文件进行统一管理和规范，设置文件目录结构，规定文件命名规则，并对上传的文件进行审核和评估。
功能： 集中存储、文件审批、权限控制，保证文件的统一性和质量。支持分类管理、标准化文档模板等。

3. 学校领导的文件审批和决策支持

场景： 学校领导需要快速审批各种文件和决策资料，如教学计划、会议纪要、预算报告等。

问题： 文件流转效率低，审批过程繁琐，容易出现文件遗失或遗漏。
解决方案： 使用网盘系统，学校领导可以在线审批、阅览和评论文件，确保审批流程的高效性和透明度。同时，网盘可以记录文件流转历史，方便追踪和管理。
功能： 文件审批流程、在线标注与评论、审批记录追踪。

4. 跨部门协作与信息共享

场景： 学校各部门之间（如教务处、行政处、后勤部门等）需要共享一些通用文档，如政策文件、规章制度、校内公告等。

问题： 信息沟通不畅，文档流转和更新滞后。
解决方案： 企业网盘可以作为跨部门的共享平台，统一存储学校的公共文档，确保不同部门能够实时访问、更新和修改文件。
功能： 跨部门共享、权限管理、协作编辑、多版本支持，确保信息的时效性和完整性。

5. 教师的在线备课与远程协作

场景： 教师需要在不同地点（例如家里、办公室、学校外部）进行备课和资料准备，并且需要与其他教师合作进行集体备课。

问题： 传统的备课方式受地点和设备限制，教师难以实时共享和协作。
解决方案： 教师可以利用网盘进行云端备课，随时随地上传、下载和修改教学资料，并可以与其他教师进行实时协作编辑。
功能： 云端文件存储、实时协作、远程访问、文件同步等，提升教师的备课效率。

6. 教务管理与教学计划的存档

场景： 学校教务部门需要保存历年的教学计划、课程安排、考试安排等重要文件。

问题： 教务文件的存储、查找和管理不便，历史文件难以检索。
解决方案： 企业网盘提供长期存档和搜索功能，所有的教学管理文档可以按学期、学年等分类进行存储，方便日后查找与归档。
功能： 文件归档、智能搜索、分类管理、备份恢复，确保文件的安全性和可追溯性。

7. 学校活动和会议记录管理

场景： 学校领导和教师需要管理学校各类活动的策划文件、会议记录、通知等。

问题： 文件容易丢失、无法及时查阅，会议记录等文件多而杂乱，管理困难。
解决方案： 使用网盘系统集中存储所有学校活动相关文件，并支持自动分类和标签管理。会议记录和策划文件可以及时上传和分享，方便所有相关人员查看。
功能： 文件上传与分享、标签管理、分类管理、搜索功能，确保文件有序存放，便于查阅。

8. 数据安全与文件备份

场景： 学校对教学资料、学生成绩、行政文件等有严格的安全要求。

问题： 文件存储在本地或外部设备上存在丢失、损坏等风险。
解决方案： 企业网盘可以提供高安全性的云端存储，定期备份文件，确保数据安全。此外，还能设置访问权限，避免未经授权的人访问敏感信息。
功能： 数据加密、自动备份、权限控制、文件恢复，保障学校文件数据的安全性和完整性。

总结

企业网盘文档管理系统可以帮助学校中的不同角色解决很多日常工作中的实际问题。通过集中管理、协作共享、文件审批和在线备课等功能，网盘系统能够提高工作效率、规范文件管理、加强跨部门协作、保证数据安全，从而为学校的教学和行政工作提供强有力的支持。

使用RAGFlow+iText2KG针对文档进行搜索与知识图片生成（一）

2024 年 11 月 25 日由admin发布在AI智能、RAG、数据增强、知识图谱在上留下评论

1、RAGFlow 的使用指南

RAGFlow 是一个基于对文档的深入理解的开源 RAG（检索增强生成）引擎。它为任何规模的企业提供了简化的 RAG 工作流程，结合了 LLM（大型语言模型）以提供真实的问答功能，并以来自各种复杂格式数据的有根据的引文为后盾。

demo链接：RAGFlow

特点：

1、有一定的数据质量保证，能从复杂的非结构化数据中提取基于文档理解的深度知识。

2、内置模板，可以基于模板形成知识库；文档分块可以实现人工干预，提高文档质量；

3、可以兼容异构数据源，支持 Word、幻灯片、excel、txt、图像、扫描副本、结构化数据、网页等。

4、自动化且轻松的 RAG 工作流程

简化的 RAG 编排同时满足了个人和大型企业的需求。
可配置的 LLM 以及嵌入模型。
多重召回与融合的重新排名配对。
直观的 API，可与业务无缝集成。
RAGFlow架构图

部署要求：

CPU >= 4 cores
RAM >= 16 GB
Disk >= 50 GB
Docker >= 24.0.0 & Docker Compose >= v2.26.1

启动服务器

确保 >= 262144：vm.max_map_count要检查的值：vm.max_map_count$ sysctl vm.max_map_count如果不是，则重置为至少 262144 的值。vm.max_map_count

# In this case, we set it to 262144:$ sudo sysctl -w vm.max_map_count=262144此更改将在系统重启后重置。为了确保您的更改保持永久，请相应地在 /etc/sysctl.conf 中添加或更新该值：vm.max_map_count
vm.max_map_count=262144
克隆存储库：$ git clone https://github.com/infiniflow/ragflow.git构建预构建的 Docker 镜像并启动服务器：
以下命令下载 RAGFlow slim （）的开发版本 Docker 映像。请注意，RAGFlow slim Docker 映像不包括嵌入模型或 Python 库，因此大小约为 1GB。dev-slim$ cd ragflow/docker$ docker compose -f docker-compose.yml up -d注意：包含嵌入模型和 Python 库的 RAGFlow Docker 映像的大小约为 9GB，加载时间可能要长得多。
- 要下载特定版本的 RAGFlow slim Docker 镜像，请将 docker/.env 中的变量更新为所需版本。例如。进行此更改后，请重新运行上述命令以启动下载。RAGFlow_IMAGERAGFLOW_IMAGE=infiniflow/ragflow:v0.12.0-slim
- 要下载 RAGFlow Docker 映像的开发版本（包括嵌入模型和 Python 库），请将 docker/.env 中的变量更新为。进行此更改后，请重新运行上述命令以启动下载。RAGFlow_IMAGERAGFLOW_IMAGE=infiniflow/ragflow:dev
- 要下载特定版本的 RAGFlow Docker 映像（包括嵌入模型和 Python 库），请将 docker/.env 中的变量更新为所需的版本。例如。进行此更改后，请重新运行上述命令以启动下载。RAGFlow_IMAGERAGFLOW_IMAGE=infiniflow/ragflow:v0.12.0
在服务器启动并运行后检查服务器状态：$ docker logs -f ragflow-server以下输出确认系统已成功启动：
____ ___ ______ ______ __
/ __ \ / | / ____// ____// /____ _ __
/ /_/ // /| | / / __ / /_ / // __ \| | /| / /
/ _, _// ___ |/ /_/ // __/ / // /_/ /| |/ |/ /
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/

* Running on all addresses (0.0.0.0)
* Running on http://127.0.0.1:9380
* Running on http://x.x.x.x:9380 INFO:werkzeug:Press CTRL+C to quit如果您跳过此确认步骤并直接登录 RAGFlow，您的浏览器可能会提示错误，因为此时您的 RAGFlow 可能没有完全初始化。network abnormal

在您的 Web 浏览器中，输入服务器的 IP 地址并登录 RAGFlow。使用默认设置时，您只需输入（sans port number）作为使用默认配置时可以省略默认 HTTP 服务端口。http://IP_OF_YOUR_MACHINE80
在 service_conf.yaml 中，选择所需的 LLM 工厂，并使用相应的 API 密钥更新字段。user_default_llmAPI_KEY有关更多信息，请参阅 llm_api_key_setup。

部署完成后，还需要对RAGFlow进行配置，需要关注以下几点：

.env：保留系统的基本设置，例如SVR_HTTP_PORTMYSQL_PASSWORDMINIO_PASSWORD
service_conf.yaml：配置后端服务。
docker-compose.yml：系统依赖 docker-compose.yml 启动。

您必须确保对 .env 文件的更改与 service_conf.yaml 文件中的更改一致。

./docker/README 文件提供了环境设置和服务配置的详细描述，您需要确保 ./docker/README 文件中列出的所有环境设置都与 service_conf.yaml 文件中的相应配置保持一致。

要更新默认 HTTP 服务端口（80），请转到 docker-compose.yml 并更改为。80:80<YOUR_SERVING_PORT>:80

对上述配置的更新需要重启所有容器才能生效：

$ docker compose -f docker/docker-compose.yml up -d

🔧 在不嵌入模型的情况下构建 Docker 镜像

此映像的大小约为 1 GB，依赖于外部 LLM 和嵌入服务。

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/
pip3 install huggingface-hub nltk
python3 download_deps.py
docker build -f Dockerfile.slim -t infiniflow/ragflow:dev-slim .

🔧 构建包含嵌入模型的 Docker 镜像

此映像的大小约为 9 GB。由于它包括嵌入模型，因此它仅依赖于外部 LLM 服务。

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/
pip3 install huggingface-hub nltk
python3 download_deps.py
docker build -f Dockerfile -t infiniflow/ragflow:dev .

🔨 从源头启动服务进行开发

安装 Poetry，如果已安装，请跳过此步骤：curl -sSL https://install.python-poetry.org | python3 –
克隆源码并安装 Python 依赖项：git clone https://github.com/infiniflow/ragflow.git
cd ragflow/
export POETRY_VIRTUALENVS_CREATE=true POETRY_VIRTUALENVS_IN_PROJECT=true
~/.local/bin/poetry install –sync –no-root # install RAGFlow dependent python modules
使用 Docker Compose 启动依赖服务（MinIO、Elasticsearch、Redis 和 MySQL）：docker compose -f docker/docker-compose-base.yml up -d
添加以下行以将 docker/service_conf.yaml 中指定的所有主机解析为：/etc/hosts127.0.0.1

127.0.0.1 es01 mysql minio redis
在 docker/service_conf.yaml 中，将 mysql 端口更新为，将 es 端口更新为，如 docker/.env 中指定。54551200

如果无法访问 HuggingFace，请将环境变量设置为使用镜像站点：HF_ENDPOINTexport HF_ENDPOINT=https://hf-mirror.com启动 backend service：
source .venv/bin/activate
export PYTHONPATH=$(pwd)bash docker/launch_backend_service.sh
安装前端依赖项：
cd webnpm install –force
将前端配置为在 .umirc.ts 更新为：proxy.targethttp://127.0.0.1:9380

启动前端服务：

npm run dev 以下输出确认系统已成功启动完成。

1、Text2KG 的使用

Text2KG是一个开源项目，能够利用大型语言模型（zero-shot）跨领域从文本中提取实体和关系，自动构建和更新知识图谱，并通过Neo4j进行可视化。

iText2KG由四个主要模块组成：文档提取器、增量实体提取器、增量关系提取器、图形集成器和可视化。它们协同工作，从非结构化文本构建和可视化知识图谱。

文档提取器（Document Distiller）：该模块处理原始文档，并根据用户定义的模式将其重新表述为语义块。它通过关注相关信息并以预定义的格式对其进行结构化来提高信噪比。
增量实体提取器（Incremental Entity Extractor）：此模块从语义块中提取唯一实体并解决歧义以确保每个实体都有明确定义。它使用余弦相似度度量将局部实体与全局实体进行匹配。
增量关系提取器（Incremental Relation Extractor）：此模块识别提取实体之间的关系。它可以以两种模式运行：使用全局实体丰富图形中的潜在信息，或使用局部实体建立更精确的关系。
图形集成器和可视化（Graph Integrator and Visualization）：此模块将提取的实体和关系集成到 Neo4j 数据库中，提供知识图谱的可视化表示。它允许对结构化数据进行交互式探索和分析。

四个模块中，增量实体提取器与增量关系提取器最为关键，采用大模型来实现，LLM提取代表一个唯一概念的实体，以避免语义混合的实体。显示了使用 Langchain JSON 解析器的实体和关系提取prompt。分类如下：蓝色 – 由 Langchain 自动格式化的prompt；常规 – iText2KG设计的prompt；斜体 – 专门为实体和关系提取设计的prompt。（a）关系提取prompt和（b）实体提取prompt。

为了说明知识图谱构建的结果，在三种不同场景下，将基线方法与iText2KG进行了比较：

基线方法在所有三种知识图谱构建场景中都揭示了存在没有关系的孤立节点。这种现象可能归因于实体提取和关系提取的同时执行，这可能会在语言模型中引起幻觉效应，导致“遗忘”效应，即分离实体和关系提取的过程可以提高性能。
在“网站到知识图谱”的场景中，输入文档数量的增加与图中噪声节点的出现有关。这强调了对文档进行有效精炼和蒸馏的模块1的关键需求。
iText2KG方法在三种知识图谱构建场景中展示了改进的实体和关系解析能力。当输入文档较少且由简单、非复杂短语组成时，语言模型在实体和关系解析方面表现出高效率，如“简历到知识图谱”过程中所证明的。相反，随着数据集变得更加复杂和庞大，挑战也随之增加，如“网站到知识图谱”场景所示。此外，重要的是要强调输入文档的分块大小和阈值对知识图谱构建的影响。文档分馏器的输入文档可以是独立的文档或分块。如果分块大小较小，则语义块将从文档中捕获更具体的详细信息，反之亦然

一种由 LLM 驱动的零样本方法，使用大型语言模型构建增量知识图谱（KG）

iText2KG 是一个 Python 包，通过利用大型语言模型从文本文档中提取实体和关系，逐步构建具有已解析实体和关系的一致知识图谱。

它具有零样本能力，无需专门的训练即可跨各个领域提取知识。

它包含四个模块：文档提炼器、增量实体提取器、增量关系提取器和图形集成器与可视化。

文档提取器：此模块将原始文档重新表述为预定义的语义块，并由指导 LLM 提取特定信息的模式引导。
增量实体提取器：此模块识别并解析语义块内的唯一语义实体，确保实体之间的清晰度和区别。
增量关系提取器：此组件处理已解析的实体以检测语义上唯一的关系，解决语义重复的挑战。
Neo4j 图形集成器：最后一个模块以图形格式可视化关系和实体，利用 Neo4j 进行有效表示。

对于我们的 iText2KG 它包含了两大特点

增量构建：iText2KG 允许增量构建 KG，这意味着它可以在新数据可用时不断更新和扩展图，而无需进行大量重新处理。
零样本学习：该框架利用 LLM 的零样本功能，使其无需预定义集或外部本体即可运行。这种灵活性使其能够适应各种 KG 构建场景，而无需进行大量训练或微调。

一、设置模型

在运行 iText2KG 之前，我们先设置好大模型，我这里选择的是 OpenAi 的模型以及 HuggingFace 的 bge-large-zh embedding 模型。这么选择也是考虑到构建 KG 的准确度。

from langchain_openai import ChatOpenAI, OpenAIEmbeddings
import os
os.environ["OPENAI_API_KEY"] = "*****"
openai_api_key = os.environ["OPENAI_API_KEY"]
openai_llm_model = llm = ChatOpenAI(
    model="gpt-4o-mini",
    temperature=0,
    max_tokens=None,
    timeout=None,
    max_retries=2,
)
messages = [
    (
        "system",
        "You are a helpful assistant that translates English to French. Translate the user sentence.",
    ),
    ("human", "I love programming."),
]

ai_msg=openai_llm_model.invoke(messages)

开始部署我们的 Embedding 模型：

from langchain_huggingface.embeddings import HuggingFaceEmbeddings
openai_embeddings_model = HuggingFaceEmbeddings(model_name="BAAI/bge-large-zh-v1.5")
text = "This is a test document."
query_result = openai_embeddings_model.embed_query(text)
query_result[:3]
doc_result = openai_embeddings_model.embed_documents([text])

二、使用 `iText2KG` 构建 `KG`

我们这里的场景是，给出一篇简历，使用知识图谱将在线职位描述与生成的简历联系起来。

设定目标是评估候选人是否适合这份工作。

我们可以为 iText2KG 的每个模块使用不同的 LLM 或嵌入模型。但是，重要的是确保节点和关系嵌入的维度在各个模型之间保持一致。

如果嵌入维度不同，余弦相似度可能难以准确测量向量距离以进行进一步匹配。

我们的简历放到根目录，加载简历：

from langchain.document_loaders import PyPDFLoader
loader = PyPDFLoader(f"./CV_Emily_Davis.pdf")
pages = loader.load_and_split()

初始化 DocumentDistiller 引入 llm ：

from itext2kg.documents_distiller import DocumentsDisiller, CV
document_distiller = DocumentsDisiller(llm_model = openai_llm_model)

信息提炼：

IE_query = '''
# DIRECTIVES :
- Act like an experienced information extractor.
- You have a chunk of a CV.
- If you do not find the right information, keep its place empty.
'''
# 使用定义好的查询和输出数据结构提炼文档。
distilled_cv = document_distiller.distill(documents=[page.page_content.replace("{", '[').replace("}", "]") for page in pages], IE_query=IE_query, output_data_structure=CV)

将提炼后的文档格式化为语义部分。

semantic_blocks_cv = [f"{key} - {value}".replace("{", "[").replace("}", "]") for key, value in distilled_cv.items() if value !=[] and value != ""  and value != None]

我们可以自定义输出数据结构，我们这里定义了4种，工作经历模型，岗位，技能，证书。

from pydantic import BaseModel, Field
from typing import List, Optional

class JobResponsibility(BaseModel):
    description: str = Field(..., description="A specific responsibility in the job role")

class JobQualification(BaseModel):
    skill: str = Field(..., description="A required or preferred skill for the job")

class JobCertification(BaseModel):
    certification: str = Field(..., description="Required or preferred certifications for the job")

class JobOffer(BaseModel):
    job_offer_title: str = Field(..., description="The job title")
    company: str = Field(..., description="The name of the company offering the job")
    location: str = Field(..., description="The job location (can specify if remote/hybrid)")
    job_type: str = Field(..., description="Type of job (e.g., full-time, part-time, contract)")
    responsibilities: List[JobResponsibility] = Field(..., description="List of key responsibilities")
    qualifications: List[JobQualification] = Field(..., description="List of required or preferred qualifications")
    certifications: Optional[List[JobCertification]] = Field(None, description="Required or preferred certifications")
    benefits: Optional[List[str]] = Field(None, description="List of job benefits")
    experience_required: str = Field(..., description="Required years of experience")
    salary_range: Optional[str] = Field(None, description="Salary range for the position")
    apply_url: Optional[str] = Field(None, description="URL to apply for the job")

定义一个招聘工作需求的描述：

job_offer = """
About the Job Offer
THE FICTITIOUS COMPANY

FICTITIOUS COMPANY is a high-end French fashion brand known for its graphic and poetic style, driven by the values of authenticity and transparency upheld by its creator Simon Porte Jacquemus.

Your Role

Craft visual stories that captivate, inform, and inspire. Transform concepts and ideas into visual representations. As a member of the studio, in collaboration with the designers and under the direction of the Creative Designer, you should be able to take written or spoken ideas and convert them into designs that resonate. You need to have a deep understanding of the brand image and DNA, being able to find the style and layout suited to each project.

Your Missions

Translate creative direction into high-quality silhouettes using Photoshop
Work on a wide range of projects to visualize and develop graphic designs that meet each brief
Work independently as well as in collaboration with the studio team to meet deadlines, potentially handling five or more projects simultaneously
Develop color schemes and renderings in Photoshop, categorized by themes, subjects, etc.
Your Profile

Bachelor’s degree (Bac+3/5) in Graphic Design or Art
3 years of experience in similar roles within a luxury brand's studio
Proficiency in Adobe Suite, including Illustrator, InDesign, Photoshop
Excellent communication and presentation skills
Strong organizational and time management skills to meet deadlines in a fast-paced environment
Good understanding of the design process
Freelance cont

继续使用上面方法做信息提炼：

IE_query = '''
# DIRECTIVES :
- Act like an experienced information extractor.
- You have a chunk of a job offer description.
- If you do not find the right information, keep its place empty.
'''
distilled_Job_Offer = document_distiller.distill(documents=[job_offer], IE_query=IE_query, output_data_structure=JobOffer)
print(distilled_Job_Offer)
semantic_blocks_job_offer = [f"{key} - {value}".replace("{", "[").replace("}", "]") for key, value in distilled_Job_Offer.items() if value !=[] and value != ""  and value != None]

到这里准备工作完成，简历和工作需求都已经提炼完毕，然后正式开始构建 graph，我们将简历的所有语义块作为一个块传递给了 LLM。

也将工作需求作为另一个语义块传递，也可以在构建图时将语义块分开。

我们需要注意每个块中包含多少信息，然后好将它与其他块连接起来，我们在这里做的就是一次性传递所有语义块。

from itext2kg import iText2KG
itext2kg = iText2KG(llm_model = openai_llm_model, embeddings_model = openai_embeddings_model)

global_ent, global_rel = itext2kg.build_graph(sections=[semantic_blocks_cv], ent_threshold=0.6, rel_threshold=0.6)

global_ent_, global_rel_ = itext2kg.build_graph(sections=[semantic_blocks_job_offer], existing_global_entities = global_ent, existing_global_relationships = global_rel,  ent_threshold=0.6, rel_threshold=0.6)

iText2KG 构建 KG 的过程我们看到有很多参数，下面分贝是对每个参数的表示做一些解释：

llm_model：用于从文本中提取实体和关系的语言模型实例。
embeddings_model：用于创建提取实体的向量表示的嵌入模型实例。
sleep_time (int)：遇到速率限制或错误时等待的时间（以秒为单位）（仅适用于 OpenAI）。默认为 5 秒。

iText2KG 的 build_graph 参数：

sections (List[str])：字符串（语义块）列表，其中每个字符串代表文档的一部分，将从中提取实体和关系。
existing_global_entities (List[dict], optional)：与新提取的实体进行匹配的现有全局实体列表。每个实体都表示为一个字典。
existing_global_relationships (List[dict], optional)：与新提取的关系匹配的现有全局关系列表。每个关系都表示为一个字典。
ent_threshold (float, optional)：实体匹配的阈值，用于合并不同部分的实体。默认值为 0.7。
rel_threshold (float, optional)：关系匹配的阈值，用于合并不同部分的关系。默认值为 0.7。

从图中结果看到我们构建过程中的实体，和关联关系。

最后使用 GraphIntegrator 对构建的知识图谱进行可视化。

使用指定的凭据访问图形数据库 Neo4j，并对生成的图形进行可视化，以提供从文档中提取的关系和实体的视觉表示。

from itext2kg.graph_integration import GraphIntegrator
URI = "bolt://3.216.93.32:7687"
USERNAME = "neo4j"
PASSWORD = "selection-cosal-cubes"
new_graph = {}
new_graph["nodes"] = global_ent_
new_graph["relationships"] = global_rel_
GraphIntegrator(uri=URI, username=USERNAME, password=PASSWORD).visualize_graph(json_graph=new_graph)

打开我们的 Neo4j 图形数据库：

一粒云文件同步PC客户端功能

2024 年 11 月 23 日由admin发布在未分类在上留下评论

1. 软件介绍

网盘同步助手是一款用于PC端的网盘同步客户端应用程序，旨在帮助用户将本地文件安全、快速地备份至云端，同时也支持从云端同步文件到本地。该应用程序具备丰富的功能，如定时备份、实时监控、过滤备份、任务管理等，能够满足个人和企业用户在文件管理和数据保护方面的多样需求。通过简洁美观的用户界面，用户可以轻松管理文件同步任务，并灵活设置各种备份策略。

2. 软件功能手册

2.1 用户主动选择本地目录备份功能

目录备份到网盘
- 用户可主动选择本地电脑中的任意目录备份到网盘。
- 定时备份：支持设定某个时间点自动触发备份任务。
  - 设置备份时间：用户可以在设置中选择具体的备份时间，支持每天/每周/每月的定时任务，确保备份按时进行。
  - 重复备份：用户可设定重复规则，避免数据丢失。
- 文件过滤：用户可以设置过滤条件，指定不备份某些文件名或后缀类型的文件。
  - 支持多重条件：用户可以同时设置多个文件名或后缀类型过滤条件。
- 实时备份：开启后，文件变化实时监控，修改或新增的内容会自动增量备份至网盘。
  - 增量备份：程序会识别文件变化部分，仅上传变动部分以节省网络带宽。
  - 版本控制：用户可以选择是否保留文件的多个历史版本。
- 任务进度查看：用户可以查看备份任务的实时进度。
  - 详细状态：包括已备份文件数量、剩余时间估计、当前速度等。
- 任务日志查看：用户可查看详细的任务日志，了解任务的执行过程。
  - 日志类型：分为信息日志、警告日志和错误日志，方便用户过滤查看。
- 错误日志查看：显示备份过程中出现的错误日志，便于排查问题。
  - 自动记录：自动记录所有错误，包括网络中断、文件锁定等情况。
- 传输错误重传：对于在传输过程中出现的错误，支持自动重试传输，确保数据备份完整。
  - 重试策略：支持用户设置重试次数与间隔时间。
- 长路径支持：文件路径超过256个字符的情况也能正常处理，防止备份失败。
  - 自动路径优化：对过长路径进行优化处理，确保备份正常进行。
- 忽略删除操作：用户可选择忽略删除操作，即删除本地文件时，云端文件不受影响。
  - 可选同步策略：用户可选择是否同步删除操作，以适应不同需求。
- 高速小文件传输：支持1000万级别小文件的高速传输，确保备份过程高效。
  - 文件打包传输：对于大量小文件，支持打包后传输以提升传输效率。

2.2 用户被动文件夹备份功能

后台指定文件夹备份
- 管理员可以在后台指定某个用户PC上的文件夹进行备份，确保重要文件得到保护。
  - 后台管理界面：管理员可以通过专用的管理界面设置和监控用户备份任务。
- 文件格式过滤：管理员可以指定要备份的文件类型，过滤掉无关文件。
  - 文件类型配置：支持设置多种文件类型，管理员可灵活配置。
- 文件存储位置指定：可自定义备份文件在网盘中的存储位置，便于管理。
  - 自动目录创建：根据备份任务自动创建目标目录。
- 实时和定时模式：支持实时备份和定时备份两种模式，适应不同使用场景。
  - 智能切换：根据用户的工作时间，自动切换为实时或定时模式。
- 任务进度查看：显示备份任务的详细进度，确保备份过程的透明度。
  - 进度图形化显示：任务进度以图形方式显示，便于用户理解。
- 任务日志和错误日志查看：支持查看任务执行日志和错误日志，方便排查问题。
  - 日志导出：用户可以导出日志文件，便于后续分析和存档。
- 传输错误重传：支持传输错误时的重试功能，保证数据完整性。
  - 断点续传：在传输中断后，可以从中断点继续传输。
- 长路径支持和忽略删除操作：和主动备份相同，支持长路径问题及忽略删除操作。

2.3 用户文件同步传输功能

云盘文件同步到本地PC
- 用户可设定云盘的某个文件夹与本地指定文件夹进行同步。
  - 多任务同步：支持多个同步任务并行运行。
- 同步策略：支持实时同步和定时同步两种策略，满足用户的不同需求。
  - 冲突处理：提供文件冲突时的处理选项，如覆盖、重命名或跳过。
- 条件过滤：用户可以设置过滤条件，指定某些文件格式才能同步至本地。
  - 精确过滤：支持按文件名、文件类型、文件大小等多种条件过滤。

2.4 用户管理功能

用户账户管理
- 支持用户的登录和退出，保障数据的隐私和安全。
  - 多重认证：可选两步验证功能，增加安全性。
- 传输线程设置：用户可根据需求设置传输的线程数（1~8线程），平衡网络资源和传输速度。
  - 线程动态调整：根据网络状况自动调整线程数，确保最佳性能。
- 传输速度设置：可限制传输速度，防止影响其他网络活动。
  - 速度优先级：提供高、中、低三档传输优先级设置。
- 多语言支持：应用程序提供多语言设置，以便不同语言的用户使用。
  - 动态语言切换：支持用户在应用内实时切换语言，界面即时更新。

3. 软件操作指南

3.1 安装和启动

用户可以通过官方网站下载网盘同步助手的安装包，按照安装向导完成安装。
安装完成后，双击桌面快捷方式启动程序，首次使用需要进行账号注册和登录。

3.2 创建备份任务

点击主界面上的“创建备份任务”按钮。
选择需要备份的本地目录，并指定备份的云盘位置。
设定备份策略（定时或实时），以及备份文件的过滤条件。
点击“确认”按钮，任务创建完成，备份过程会按照设定的时间和策略执行。

3.3 查看任务状态和日志

在主界面上，可以查看当前所有任务的列表，以及各任务的进度和状态。
点击某个任务，可以查看该任务的详细日志，包括任务执行记录和错误日志。

3.4 文件同步设置

点击“文件同步”按钮，进入同步设置界面。
选择需要同步的云盘文件夹，并指定本地目标文件夹。
设置同步条件（实时、定时、文件类型过滤）后点击“确认”按钮，开始同步。

3.5 用户账户管理

用户可在“设置”界面管理账户信息，设定传输线程数、多语言选项以及传输速度。

4. 系统要求

操作系统：Windows 10及以上版本
内存：4GB以上
存储空间：500MB以上可用硬盘空间
网络连接：稳定的互联网连接

5. UI设计说明

美观简洁：基于WPF框架，采用简洁大方的现代UI设计，所有功能模块直观易用。
- 色彩搭配：采用柔和色调，避免用户长时间使用后的视觉疲劳。
清晰的任务管理界面：任务列表、日志查看、错误重传等操作都集中在一个面板，方便用户使用。
- 可折叠面板：不同任务的详情可通过折叠面板展开或隐藏，界面更加整洁。
多语言支持：提供中文、英文等多语言选择，提升用户的使用体验。
- 语言切换按钮：界面右上角提供一键切换语言的功能。

6. 客户支持

用户帮助中心：提供详细的用户手册和FAQ，用户可在应用内直接访问。
- 视频教程：提供一些基本操作的视频教程，帮助新手用户快速上手。
技术支持：用户可以通过应用内的反馈入口提交问题，客服团队会尽快给予答复。
- 在线聊天：支持通过在线聊天获取即时帮助。

一粒云核心产品功能模块简介

2024 年 11 月 21 日2024 年 11 月 22 日由admin发布在手册教程、软件更新在上留下评论

四个核心产品的功能模块概要描述

以下是一粒云科技的四个核心产品“协同办公网盘”、“文件安全交换审计系统”、“统一RAG文档搜索平台”和“ESS统一存储平台”四个产品核心功能模块的概要描述。

1. 协同办公网盘

核心功能模块及描述：

功能模块	描述
文档管理与权限划分	实现文档的集中化管理，基于用户角色和权限等级进行细粒度的访问控制，支持文档分类、归档和版本管理。
在线预览与分享协同	支持多格式文件的在线预览（如PDF、视频等），快速生成分享链接，支持设置访问权限和有效期限。
多人协同编辑	提供实时多人编辑功能，支持变更记录追溯和版本控制，方便团队协作与文档修改。
多终端文件同步与备份	实现PC端、移动端的实时文件同步与备份，支持断点续传和跨设备访问，保障文件在多设备间的一致性。
日志审计	提供详细的操作日志记录，包括文件的上传、下载、分享和编辑行为，方便管理员审计和追踪异常操作。

2. 文件安全交换审计系统

核心功能模块及描述：

功能模块	描述
多区域网段配置管理	支持不同区域、网段的配置与管理，定义文件交换的区域范围，确保跨网文件交换过程受控。
点对点的跨网文件交换	实现单点间跨网文件安全交换，保障数据传输的可靠性和安全性，适用于小范围点对点的快速文件传输。
区对区的跨网文件交换同步	提供多网段、多个区域间的文件同步与交换能力，支持大规模文件在不同网域之间高效、安全传输。
跨网审批流程图形配置	支持跨网传输的审批流程图形化配置，简化流程定义，方便管理员快速部署和调整审批策略。
敏感内容安全与病毒检测	集成敏感信息检测和病毒扫描模块，确保文件传输的内容合规和安全。
内容AI识别检测	采用AI算法对文件内容进行智能识别和分析，自动检测敏感信息、分类并标记不符合传输规范的内容。
文件安全级别设定与计算	根据文件的敏感程度自动分配安全级别，并提供动态调整机制，确保安全策略与文件的实际属性匹配。
网络边缘安全接入管理盒子	在跨网边缘部署安全接入设备，实现网络隔离的情况下文件安全交换，并防止未经授权的设备访问。

3. 统一RAG文档搜索平台

核心功能模块及描述：

功能模块	描述
多源存储的纳管	实现对多种存储类型（NAS、对象存储、分布式存储等）的统一接管和管理，消除信息孤岛，支持跨源数据搜索。
索引管理	提供高效的索引创建、更新与优化功能，支持分布式搜索，快速定位目标文档。
知识主题管理与问答	基于文档内容创建知识主题，提供主题分类和关联关系，支持智能问答和知识推荐，提升文档利用率。
基于规范规则下的文档内容鉴定	根据预定义的规则对文档内容进行自动化鉴定，识别合规性与敏感信息，分类管理不合规内容。
敏感内容信息的布控与识别处理	通过设置敏感信息的布控规则，实时监控和识别文档中的敏感内容，并对违规文档采取自动处理措施。
RAG统一搜索（数据增强生成式搜索）	提供基于生成式AI的智能搜索能力，结合外部知识库和现有文档，实现上下文增强的内容生成与精准查询。

4. ESS统一存储平台

核心功能模块及描述：

功能模块	描述
统一存储（文件、对象、块、生命周期）	支持文件存储、对象存储和块存储的统一管理，提供自动化的存储生命周期策略，实现数据分级存储与清理。
安全与管理	提供快照、克隆、容灾和高可用（HA）支持，配置故障隔离和精简管理功能，保障存储系统的安全性与可靠性。
访问控制	支持QoS（服务质量控制）、ACL（访问控制列表）权限管理、多副本机制、断点续传和WORM（一次写入多次读取）功能。
性能监控	提供IOPS（每秒输入输出操作数）、纠删码支持、快速数据恢复等性能监控功能，保障存储系统的高效运行。
硬件管理与告警	实现对存储设备（SSD、HDD、磁带等）健康状态的监控与告警，支持硬件异常的实时检测与处理。

价值总结

协同办公网盘：聚焦企业内外部团队协作与文档管理，提升协作效率。
文件安全交换审计系统：解决跨网环境下的文件安全传输，确保内容合规与传输安全。
统一RAG文档搜索平台：通过智能搜索和内容分析提升文档检索效率，推动知识管理优化。
ESS统一存储平台：统一存储与安全管控，满足大规模、高复杂度存储需求，确保高性能和高可用性。

如果贵单位对以上产品有需求，请与我方工作人员联系。

联系工作人员

知识共享化：打破信息壁垒

知识显性化：知识内容清晰易懂

知识体系化：建立有序知识目录

知识再生化：激发持续创新

1. 知识显性化（Externalization）工具

2. 知识共享化（Socialization）工具

3. 知识体系化（Combination）工具

4. 知识再生化（Internalization）工具

集成与自动化工具（增强整体效率）

一、为什么需要企业知识目录？

1. 避免信息过载

2. 提高学习与决策效率

二、构建企业知识目录的核心步骤

1. 知识梳理与分类

2. 知识点关联与结构化

3. 知识标签与检索优化

三、企业网盘知识目录架构设计示例

1. 公司政策与规章制度

2. 项目管理与运营

3. 产品与服务支持

4. 客户与市场资料

5. 培训与学习资源

权限与安全控制示例：

1. 防止勒索病毒的“第一道屏障”

2. 分布式存储，确保文件安全

3. 独立的备份与快照机制，轻松恢复数据

案例说明：深圳某创新科技公司，四年内两次遭遇勒索病毒，均成功恢复

一粒云，保护数据安全，提高协同效率

一粒云KWS隔离网文件安全交换系统助力企业防止数据泄露

高德红外事件暴露企业数据安全管理的隐患

一粒云KWS隔离网文件安全交换系统：为企业核心技术保驾护航

核心功能：

企业应用案例：一粒云KWS系统助力多个行业数据安全

早做准备，杜绝高风险事件发生

1. 教师之间的协作和资源共享

2. 学科组长的教学资源整合和管理

3. 学校领导的文件审批和决策支持

4. 跨部门协作与信息共享

5. 教师的在线备课与远程协作

6. 教务管理与教学计划的存档

7. 学校活动和会议记录管理

8. 数据安全与文件备份

总结

4、 自动化且轻松的 RAG 工作流程

启动 服务器

🔧 在不嵌入模型的情况下构建 Docker 镜像

🔧 构建包含嵌入模型的 Docker 镜像

🔨 从源头启动服务进行开发

一 、设置模型

二 、使用 iText2KG 构建 KG

1. 软件介绍

2. 软件功能手册

2.1 用户主动选择本地目录备份功能

2.2 用户被动文件夹备份功能

2.3 用户文件同步传输功能

2.4 用户管理功能

3. 软件操作指南

3.1 安装和启动

3.2 创建备份任务

3.3 查看任务状态和日志

3.4 文件同步设置

3.5 用户账户管理

4. 系统要求

5. UI设计说明

6. 客户支持

四个核心产品的功能模块概要描述

1. 协同办公网盘

2. 文件安全交换审计系统

3. 统一RAG文档搜索平台

4. ESS统一存储平台

价值总结

4、自动化且轻松的 RAG 工作流程

启动服务器

一、设置模型

二、使用 `iText2KG` 构建 `KG`