随着人工智能技术的迅猛发展,开源社区涌现出了许多关于AI的项目,这些项目不仅展示了技术的创新力,也为开发者提供了丰富的工具和资源。本文将介绍几个既有趣又实用的开源人工智能工具,它们不仅能够帮助你加深对人工智能技术的理解,还能在实际应用中大显身手。


Open AI-Cook Book

Open AI-Cook Book 是一本 Open AI 的 API 使用指南,提供了一些通过 Open AI 的 API 搭建任务的示例代码。

Github: https://github.com/openai/openai-cookbook

官方文档请访问:
https://cookbook.openai.com/

动手学大模型应用开发(中文)

Github:https://github.com/datawhalechina/llm-universe

官方文档:
https://datawhalechina.github.io/llm-universe/

本项目是一个面向小白开发者的大模型应用开发教程,旨在基于阿里云服务器,结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门,主要内容包括:

  1. 1. 大模型简介,何为大模型、大模型特点是什么、LangChain 是什么,如何开发一个 LLM 应用,针对小白开发者的简单介绍;
  2. 2. 如何调用大模型 API,本节介绍了国内外知名大模型产品 API 的多种调用方式,包括调用原生 API、封装为 LangChain LLM、封装为 Fastapi 等调用方式,同时将包括百度文心、讯飞星火、智谱AI等多种大模型 API 进行了统一形式封装;
  3. 3. 知识库搭建,不同类型知识库文档的加载、处理,向量数据库的搭建;
  4. 4. 构建 RAG 应用,包括将 LLM 接入到 LangChain 构建检索问答链,使用 Streamlit 进行应用部署
  5. 5. 验证迭代,大模型开发如何实现验证迭代,一般的评估方法有什么;

开源大模型食用指南(中文)

Github: https://github.com/datawhalechina/self-llm

《开源大模型食用指南》基于Linux环境快速部署开源大模型,更适合中国宝宝的部署教程

本项目是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。


Stable Diffusion web UI

Github:https://github.com/AUTOMATIC1111/stable-diffusion-webui

使用 Gradio 库实现的 Stable Diffusion的 Web 界面,STAR数: 135k+


Stable Diffusion 是一种神经网络模型,专门用于生成图像。这个项目提供了一个Web界面,使用户能够直观地与稳定扩散模型进行交互和使用。通过这个界面,用户可以上传图像或调整参数,然后观察模型生成的图像输出。这种界面通常使得复杂的深度学习模型更易于使用和测试,适用于艺术创作、图像编辑等应用场景。

AI 换脸工具

Github: https://github.com/iperov/DeepFaceLive

AI 换脸工具 适用于视频聊天的 AI 换脸模型,你可以使用这个 AI 模型替换摄像头中的面部或视频中的面部。

目前仓库不再更新, 2023 年 11 月 9 日存档,它现在是只读的。


Danswer

Github: https://github.com/danswer-ai/danswer.git

Danswer 是一个开源企业问答工具。当你使用 Danswer 时,只需以自然的方式提出问题,就像与朋友交谈一样简单,它会自动搜索公司内部的文件和资料,然后给你一个可靠的答案,并附上来源。除此之外,Danswer 还可以和其他常用的工具一起使用,比如 Slack、GitHub、Confluence 等。这样你可以更方便地获取答案,同时也可以和团队成员一起分享和讨论。

功能特性

  • • answer 提供直接问答功能,它由生成式 AI 模型驱动,所得答案都有引用和来源链接支持。
  • • 智能文档检索采用最新的 LLMs 进行语义搜索和重新排序。
  • • AI 助手由定制的深度学习模型支持,可以解释用户意图。
  • • 已包含用户认证和文档级别的访问管理功能。
  • • 可以连接到 Slack、GitHub、GoogleDrive、Confluence、本地文件和网络爬虫等,未来还会添加更多连接方式。
  • • 管理仪表盘可以管理连接器,并设置功能,比如实时更新获取。
  • • 只需一行 Docker Compose(或 Kubernetes)命令,即可在任何地方部署 Danswer。

wukong-robot

Github:https://github.com/wzpan/wukong-robot

官网:
https://wukong.hahack.com/

wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持ChatGPT多轮对话能力,还可能是首个支持脑机交互的开源智能音箱项目。


mi-gpt

Github:https://github.com/idootop/mi-gpt

将小爱音箱接入 ChatGPT 和豆包,改造成你的专属语音助手。


在这个数字化的世界里,家已不仅仅是一个居住的地方,而是我们数字生活的延伸。

MiGPT 通过将小爱音箱、米家智能设备,与 ChatGPT 的理解能力完美融合,让你的智能家居更懂你。

MiGPT 不仅仅是关于设备自动化,而是关于:打造一个懂你、有温度、与你共同进化的家。

未来,你的每个智能家居设备,从灯泡、插座,到扫地机器人、电视等,

都可以作为一个个独立的智能体 (Agent),更智能、更贴心的响应你的指令。

这些独立的智能体,也可以彼此感知,彼此配合,构成一个更强大的协作网络。

而小爱音箱就像是你的智能家居专属管家,全心全意为你服务,释放智能家居的真正潜力。

MaxKB

Github:https://github.com/1Panel-dev/MaxKB

官方文档:https://maxkb.cn/

文档:https://maxkb.cn/docs/

飞致云旗下开源产品,基于 LLM 大语言模型的知识库问答系统

  • • 开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化、RAG(检索增强生成),智能问答交互体验好;
  • • 模型中立:支持对接各种大语言模型,包括本地私有大模型(Llama 3 / Qwen 2 等)、国内公共大模型(通义千问 / 智谱 AI / 百度千帆 / Kimi / DeepSeek 等)和国外公共大模型(OpenAI / Azure OpenAI / Gemini 等);
  • • 灵活编排:内置强大的工作流引擎,支持编排 AI 工作过程,满足复杂业务场景下的需求;
  • • 无缝嵌入:支持零编码快速嵌入到第三方业务系统,让已有系统快速拥有智能问答能力,提高用户满意度。

Lobe Chat

现代化设计的开源 ChatGPT/LLMs 聊天应用与开发框架,支持语音合成、多模态、可扩展的(function call)插件系统,一键免费拥有你自己的
ChatGPT/Gemini/Claude/Ollama 应用

Github:https://github.com/lobehub/lobe-chat

中文:
https://github.com/lobehub/lobe-chat/blob/main/README.zh-CN.md


ChatGPT-Next-Web

Github:https://github.com/ChatGPTNextWeb/ChatGPT-Next-Web

中文:
https://github.com/ChatGPTNextWeb/ChatGPT-Next-Web/blob/main/README_CN.md

演示:https://app.nextchat.dev/

A cross-platform ChatGPT/Gemini UI (Web / PWA / Linux / Win / MacOS). 一键拥有你自己的跨平台 ChatGPT/Gemini 应用。

一键免费部署你的私人 ChatGPT 网页应用,支持 GPT3, GPT4 & Gemini Pro 模型。


GeminiPro-Next-Web

Github:https://github.com/lchh5/GeminiPro-Next-Web

中文:
https://github.com/lchh5/GeminiPro-Next-Web/blob/main/README_CN.md

演示:
https://chat.googlegemini.co/

一键免费部署你的跨平台私人 Gemini 应用, 支持Gemini Pro 模型,基于 ChatGPT Next Web。

simple-one-api

Github:https://github.com/fruitbars/simple-one-api

OpenAI 接口接入适配,支持千帆大模型平台、讯飞星火大模型、腾讯混元以及MiniMax、Deep-Seek,等兼容OpenAI接口,仅单可执行文件,配置超级简单,一键部署,开箱即用. Seamlessly integrate with OpenAI and compatible APIs using a single executable for quick setup and deployment.

目前市面上免费的使用国产的免费大模型越来越多,one-api对于个人用起来还是有点麻烦,就想要一个不要统计、流量、计费等等的适配程序即可。

还有一点是:即使有些厂商说兼容openai的接口,但是实际上还是存在些许差异的!!!

simple-one-api主要是解决以上2点,旨在兼容多种大模型接口,并统一对外提供 OpenAI 接口。通过该项目,用户可以方便地集成和调用多种大模型,简化了不同平台接口差异带来的复杂性。


Noi

Github:https://github.com/lencx/Noi

官网:
https://noi.nofwl.com/zh-CN/

中文介绍:
https://mp.weixin.qq.com/s/dAN7LOw7mH609HdAyEvXfg

ChatGPT、Gemini、Poe等AI桌面应用工具(适用于 Mac、Windows 和 Linux)


ChatTTS

Github:https://github.com/2noise/ChatTTS

中文:
https://github.com/2noise/ChatTTS/blob/main/docs/cn/README.md

一款适用于日常对话的生成式语音模型。

亮点

你可以参考 Bilibili 上的这个视频,了解本项目的详细情况。

  1. 1. 对话式 TTS: ChatTTS 针对对话式任务进行了优化,能够实现自然且富有表现力的合成语音。它支持多个说话者,便于生成互动式对话。
  2. 2. 精细的控制: 该模型可以预测和控制精细的韵律特征,包括笑声、停顿和插入语。
  3. 3. 更好的韵律: ChatTTS 在韵律方面超越了大多数开源 TTS 模型。我们提供预训练模型以支持进一步的研究和开发。

Awesome-ChatTTS

Github: https://github.com/panyanyany/Awesome-ChatTTS

ChatTTS资源大全,免费体验地址,音色库等


MiniGPT-4

Github: https://github.com/Vision-CAIR/MiniGPT-4

官网:
https://minigpt-4.github.io/

MiniGPT-4 中文部署翻译:
https://github.com/RiseInRose/MiniGPT-4-ZH

MiniGPT-4: 使用先进的大型语言模型增强视觉语言理解

所属机构为沙特阿拉伯国王科技大学


facechain

Github:https://github.com/modelscope/facechain

中文简介:
https://github.com/modelscope/facechain/blob/main/README_ZH.md

FaceChain是一个可以用来生成个人写真的深度学习模型工具。在最新的FaceChain FACT版本中,用户仅需要提供一张照片即可10秒钟获得独属于自己的个人写真(支持多种风格)。FaceChain可实现兼具可控性与ID保持能力的无限风格写真与固定模板写真功能,同时对ControlNet和LoRA具有优秀的兼容能力。FaceChain支持在gradio的界面中使用模型训练和推理能力、支持资深开发者使用python脚本进行训练推理,也支持在sd webui中安装插件使用。


Open-Sora

Github:https://github.com/hpcaitech/Open-Sora

中文:
https://github.com/hpcaitech/Open-Sora/blob/main/docs/zh_CN/README.md

官网:
https://hpcaitech.github.io/Open-Sora/

Open-Sora:让所有人都能轻松制作高效视频。

我们设计并实施了Open-Sora,这是一项致力于高效制作高质量视频的计划。我们希望让所有人都能使用模型、工具和所有细节。通过采用开源原则,Open-Sora 不仅使高级视频生成技术的使用变得民主化,而且还提供了一个简化且用户友好的平台,简化了视频生成的复杂性。借助 Open-Sora,我们的目标是在内容创作领域促进创新、创造力和包容性。



 

扫描下方二维码,一个老毕登免费为你解答更多软件开发疑问!

AI驱动的CRM开发实战:客户流失预测模型搭建与调参技巧

客户流失是企业的核心痛点之一。根据中国信通院2025年数据显示,采用AI技术优化客户流失预测的企业,客户留存率平均提升23%,营销成本降低37%。本文将深度解析从数据采集到模型部署的全流程技术方案,并提供可落地的调参策略与成本模型。一、数据工程:构建预测模型的燃料库1.多源数据整合结构化数据:整合交易记录(购买频率、客单价)、服务工单(投诉次数、响应时效)、账户信息(注册时长、会员等级)等,需通过

英伟达CES 2025震撼发布:“物理AI”开启智能新纪元

在科技界的年度盛宴——CES 2025国际消费电子展上,英伟达CEO黄仁勋的一席话如同石子投入平静的湖面,激起了层层涟漪。他提出的“物理AI”概念,不仅让在场的科技迷们眼前一亮,更预示着AI技术即将迈入一个全新的发展阶段。在这个舞台上,AI不再仅仅是数据的搬运工,而是开始理解重力、摩擦力等物理规律,与人类实现更加动态、智能的互动。“物理AI”,这一听起来既神秘又充满未来感的词汇,其实质是AI技术与

区块链与AI技术的融合:塑造未来数字生态的基石

在当今这个日新月异的数字时代,区块链与AI技术如同两颗璀璨的明星,各自在科技领域中闪耀着独特的光芒。而随着技术的不断演进,这两大前沿技术的融合正成为软件开发领域的一股不可阻挡的潮流。区块链技术的去中心化、不可篡改性等特点,为AI技术提供了更为安全、可靠的数据支持,共同推动着金融、供应链管理等多个领域的革新与发展。一、区块链与AI技术的互补优势区块链,这一分布式数据库技术,以其独特的去中心化、信息不

AI赋能软件开发:一场悄然进行的流程革命

在科技飞速发展的今天,AI(人工智能)技术正以前所未有的速度渗透到各行各业,软件开发领域也不例外。想象一下,曾经那些繁琐、重复的代码编写与调试工作,如今只需轻点鼠标,就能由AI助手轻松搞定,这无疑为开发者们开启了一扇通往高效与创新的大门。今天,就让我们一同探讨AI如何改变软件开发流程,以及这一变革背后的深远影响。AI:软件开发的超级加速器在软件开发的世界里,时间就是金钱,效率就是生命。AI技术的引

微信小程序

微信扫一扫体验

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部