内容持续更新中
本文PPT由腾讯工程师Tommie制作,版权归其所有 本文以 PPT 式风格直观呈现技术精髓,深入揭秘 DeepSeek 核心技术。首先概述了DeepSeek的特点,包括内容token化、训练前需要将…
知识蒸馏是一种将复杂的大型模型(教师模型)的知识迁移到较小的模型(学生模型)中的技术。在这个过程中,教师模型的推理能力和知识被提炼并转移到学生模型中,从而使学生模型能够在保持较高性能的同时,具有更低的…
Kimi K1.5 作为一款前沿的多模态大语言模型,凭借其独特的强化学习训练方式和创新技术,展现出卓越的性能,在多个领域取得了显著成果,为人工智能的发展开辟了新路径。今天我们一起了解一下kimi1.5…
本文是 OpenAI 官方推出的推理模型最佳实践指南,参考意义重大。它详细介绍了 OpenAI 的推理模型和 GPT 模型之间的区别,以及如何根据不同的应用场景选择合适的模型。虽然本文主要针对 Ope…
Web Agent是这样一种特殊的智能体:它借助AI自动控制你的浏览器,并完成你“交代”的任务。比如帮你挑选一部最新的iPhone或者到旅行网站预订机票。这样的智能数字助手,无论是对生活还是工作,未来…
爆肝了几篇DeepSeek的文章,发现很多人不知道API和官方APP有什么区别,或者说不知道API有什么用。 其实使用API可是实现很多DIY的功能,比如: 在苹果手机上,通过API将大模型和Siri…
鲁棒性(Robustness),又称健壮性、稳健性,是一个在工程学、计算机科学、统计学、生态学以及许多其他领域都广泛使用的重要概念。 简单来说,鲁棒性指的是系统、组件、组织或概念在面对变化、压力、干扰…
深度学习的世界里,模型的性能往往取决于无数个细节,而超参数的设置无疑是其中最为关键的一环。超参数,这些在训练开始之前就需要设定的参数,就像是深度学习模型的“基因”,决定了模型的结构、学习速率以及优化方…
人工智能(AI)技术正在快速渗透到各行各业,从自动驾驶到语音识别,从智能客服到医疗诊断,AI的应用范围已经无处不在。然而,AI技术的强大并不仅仅依赖于先进的算法和模型,更依赖于数据的质量。而在数据的获…
2025年1月20日,深度求索(DeepSeek)正式发布新一代通用模型R1,其综合性能直指OpenAI o1系列标杆。作为国产AI技术的突破性成果,R1不仅开源模型权重,更通过API开放思维链推理能…