5 月 22 日,Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道:「经过一些数学重写,结果发现 Transformer 的所有内容都是一系列 GEMM + epilogue(矩阵乘法加尾声)。给定一些优化的原语,LLM(以及新手)就可以为所有 Transformer 操作编写光速内核!」 Tri Dao 是 FlashAttention 系列的核心作者之一,而这条推文则指 ...
😸一个快速开发脚手架,快速搭建企业级后台管理系统,并提供多种便捷starter进行功能扩展。主要功能包括前后台用户分离,菜单权限,数据权限,定时任务,访问日志,操作日志,异常日志,统一异常处理,XSS过滤,SQL防注入,国际化 等多种功能 ...
我做了 10 年后端架构,见过太多团队把「Spring」「Spring Boot」「Spring Cloud」当同一个东西装,结果踩到各种依赖冲突的坑。今天 Skill 生态正在重演这个故事,而且节奏快 10 倍。这篇文章把三大体系的设计哲学差异拆清楚,给你一个真正能用的选型矩阵。 打开 ...
合肥工业大学宣城校区大四上学期(2020年-2021年第一学期)课程有关资料汇总 蒟蒻的初衷是,給自己的资料留一个备份,也希望給有需要的后来人一点参考。 有些文件超过了100 MB,蒟蒻为了上传成功只能分卷压缩。上传的所有文件总大小约为1.31 GB 个人 ...