共计 24 篇文章
2025
论文总结 | Next Token Prediction Towards Multimodal Intelligence A Comprehensive Survey
Self-Attention 算法简介
ONNX 静态图转换为动态图
CPU 忙等的死锁案例
MiniCPM-O-2_6 模型结构介绍
关于 DeepSeek-R1-Distill-Qwen-1.5B 显存占用比下载权重高非常多的现象分析
2024
opencl-tips
将 ViT 的第一个卷积层转为 MatMul,要求步长和卷积核相等
llama.cpp Q 量化方式总结
MNN 自定义算子,以 AnyNet 为例