爱可可小窝

科研数据分享最佳实践

原文：How to make your scientific data accessible, discoverable and useful 这篇文章讨论了在开放科学和可重复性的背景下发布可用和高质量数据的最佳实践。越来越多的研究人员被鼓励在发表论文的同时提交数据，但在处理来自不同来源和格式的数据时可能会遇到挑战。以下是一些数据科学家建议的关键做法：制定元数据: 元数据描述数据，对于使...

发布于 2023-06-29

图解：私有知识库LLM聊天机器人

原文：LLM based Chatbot to query Private Knowledge Base LLM based Chatbot to query Private Knowledge Base 将整个知识库的文本语料分割成多个块——每个块表示一个可查询的上下文片段，知识数据可以来自多个源；用嵌入(Embedding)模型将每个块转换为一个向量；将所有向量存储在向量数据库；...

发布于 2023-06-28

LLM赋能的自主智能体(Agent)

原文：LLM Powered Autonomous Agents 以LLM（大型语言模型）作为核心控制器构建智能体的概念很酷。一些概念验证演示，如AutoGPT、GPT-Engineer和BabAGI，都是令人鼓舞的示例。LLM的潜力不仅限于生成书面副本、故事、论文和程序，它可以被视为强大的通用问题求解器。LLM驱动的自主智能体系统概述：LLM作为智能体的大脑，配合几个关键组件：子目标规划和...

发布于 2023-06-28

学术界能否与资源雄厚的工业界相竞争？计算机图形学的历史观点

原文：Can academia compete with the resources of industry? - A historical perspective from Computer Graphics 文章探讨了学术界与资源雄厚的工业界相竞争的问题。作者回顾了计算机图形学领域的发展历程，并指出工业界在数据规模、计算集群和工程团队等方面具有优势。然而，学术界并没有试图复制工业界的成就...

发布于 2023-06-28

Open LLM Leaderboard排名之谜

原文：What’s going on with the Open LLM Leaderboard? 本文讨论了Open LLM Leaderboard上MMLU评估的差异问题。不同的评估实现会给出不同的结果，并且可能改变模型在Leaderboard上的排名。作者强调了评估与实现细节密切相关，开放、标准化和可复现的基准测试对于改进LLM非常重要。介绍了三种不同的MMLU评估实现，即Harnes...

发布于 2023-06-27

关于大型语言模型评估的思考

原文：The Curious Case of LLM Evaluations 语言模型评估的复杂性和挑战作者在本文中讨论了语言模型（LLMs）评估中的复杂问题和挑战。他指出随着建模、扩展和泛化技术的快速发展，我们的基准测试能力却没有同步增长，导致了评估的不足和过度夸大的能力。即使每一项能力都非常优秀，如果我们没有合适的工具来了解这些能力是如何实现的，或者模型在这些能力上的表现如何，那么我们可...

发布于 2023-06-27

脚本(Script)与程序(Program)

原文：Failing to draw lines between ‘script’ and ‘program’ Unix脚本与程序：关于术语的辩论本文讨论了在Unix环境中关于“script”（脚本）和“program”（程序）的术语辩论。投票者提出了一些模糊的观点，并提供了一些实践中的思考。投票结果和模糊观点投票中，有人选择了“complex/simple”（复杂/...

发布于 2023-06-26

AI工程师入门指南

原文：Ask HN: How to Break into AI Engineering 文章提到了学习AI工程所需的技能和知识的一些资源，包括数学基础、统计学、Python编程、IBM数据科学专业证书、机器学习和深度学习专业课程等。还讨论了数学在软件工程师中的重要性以及AI工程的发展趋势。要点：要成为AI工程师，需要有扎实的数学基础，尤其是微积分和线性代数。需要掌握统计学的语言和基本...

发布于 2023-06-26

聪明人解决难题可能更慢

原文：Intelligent people take longer to solve hard problems 智力高的人在解决难题时需要更长的时间一项新研究挑战了高智商与信息处理速度快的信念，揭示了解决问题能力与大脑连接性和额叶与顶叶之间同步的关联。研究结果表明，在认知过程中速度和准确性之间存在权衡，强调了在解决困难问题和做出更好决策时较慢和更费力思考的重要性。 1. 智力高的人解决复杂...

发布于 2023-06-26

用LLM生成SQL的注意事项

原文：Generating SQL with LLMs for fun and profit SQL语言模型存在潜在的安全风险SQL（结构化查询语言）是一种编程语言，一些实现甚至是图灵完备的。连接语言模型和SQL数据库的教程已经出现，但这样的模型可能生成不安全的SQL语句。恶意用户可以利用这一点进行数据库攻击，如删除或更改表，甚至可能导致CPU的无限循环。 1. 教程中的SQL模型存在潜在安...

发布于 2023-06-26

1 234