Yet Another 何榜文's Blog
Benchmark
标签 - Benchmark
2026
2026-06-16
论文速读:在移动 NPU 上跑通端到端 RAG——高通 Hexagon 的 Benchmark 答卷
何榜文
文章
50
标签
89
分类
8
Follow Me
公告
One week is 2% of a year
最新文章
论文速读:在移动 NPU 上跑通端到端 RAG——高通 Hexagon 的 Benchmark 答卷
2026-06-16
端侧 AI 推理框架周报(2026-06-07 ~ 2026-06-14)
2026-06-14
端侧 AI 推理框架周报(2026-05-17 ~ 2026-05-23)
2026-05-24
端侧 AI 推理框架周报(2026-05-10 ~ 2026-05-17)
2026-05-17
MNN Vision Encoder 内存泄漏修复与性能分析
2026-05-13
分类
AI
1
Deep Learning
1
AI 系统
8
Effective STL
6
技术分析
1
系统编程
1
论文解读
2
AI 系统
1
标签
video summarization
Vector
VLM
ncnn
TTS
数值精度
Qwen2.5-VL
tpu-mlir
内存泄漏
动态链接
MQA
software engineer
deepseek
LLM
executorch
ONNX
Containers
Delta Rule
llama.cpp
c++
Vulkan
Vision Encoder
大模型
MHA
深度学习
周报
推理框架
T9输入法
FlashAttention2
NPU
Linear Attention
CUDA
MNN
C++
Tokenizers
STL
魔法数字
加载器
端侧推理
arm
归档
六月 2026
2
五月 2026
6
四月 2026
2
三月 2026
8
七月 2025
1
六月 2025
5
四月 2025
1
三月 2025
2
网站信息
文章数目 :
50
本站访客数 :
本站总浏览量 :
最后更新时间 :