数据与AI

agent skills 数据科学、机器学习和 AI 开发技能。我们的市场提供数据分析、机器学习模型训练、LLM 集成和数据工程管道工具。非常适合数据科学家、AI 开发者和构建智能数据驱动应用的工程师。
70B模型压缩到7B还能保住90%性能?Knowledge Distillation这个操作真的绝了🔥-Skill优仓

70B模型压缩到7B还能保住90%性能?Knowledge Distillation这个操作真的绝了🔥

Knowledge Distillation是一个专注LLM压缩的实战Skill,支持将70B大模型压缩至7B同时保留90%以上性能。覆盖温度缩放、软目标、MiniLLM反向KLD、logit蒸馏等核心技术,内置生产级DistillationTra...
基因组查询还在一个个数据库手动翻?gget一条命令搞定20+数据库真的绝了🔥-Skill优仓

基因组查询还在一个个数据库手动翻?gget一条命令搞定20+数据库真的绝了🔥

gget是一个命令行与Python双模式的生物信息学工具包,统一封装了Ensembl、UniProt、AlphaFold、ARCHS4、Enrichr、OpenTargets、COSMIC等20多个主流基因组数据库的查询接口。支持基因搜索、序列...
单细胞组学分析救星来了!scvi-tools批量校正+降维一套搞定,生信人后悔没早用🔥-Skill优仓

单细胞组学分析救星来了!scvi-tools批量校正+降维一套搞定,生信人后悔没早用🔥

scvi-tools是专为单细胞基因组学设计的Python概率建模框架,基于PyTorch构建,覆盖scRNA-seq、scATAC-seq、CITE-seq、空间转录组等多种数据类型。提供scVI、scANVI、totalVI、MultiVI等十余个深...
LLM上下文窗口还在卡2k?long-context Skill让128k触手可及🔥-Skill优仓

LLM上下文窗口还在卡2k?long-context Skill让128k触手可及🔥

long-context是一个专注于Transformer模型上下文窗口扩展的Skill,集成RoPE、YaRN、ALiBi、Position Interpolation四种主流技术方案,支持将LLaMA、Mistral等预训练模型的上下文从2k-8k扩展至32...
PyMC贝叶斯建模救命了😭层次模型+MCMC采样一套搞定,概率编程真的不难!-Skill优仓

PyMC贝叶斯建模救命了😭层次模型+MCMC采样一套搞定,概率编程真的不难!

PyMC Bayesian Modeling Skill基于PyMC 5.x+,覆盖贝叶斯建模完整工作流:数据准备、模型构建、先验预测检验、MCMC采样(NUTS)、诊断分析(R-hat/ESS/发散点)、后验预测检验、模型比较(LOO/W...
药物研发人必看!datamol让RDKit操作简单10倍,分子筛选流水线一气呵成🔥-Skill优仓

药物研发人必看!datamol让RDKit操作简单10倍,分子筛选流水线一气呵成🔥

datamol是RDKit的Pythonic封装库,专为药物发现场景设计。提供分子格式转换、结构标准化、描述符计算、指纹生成、Butina聚类、多样性选择、3D构象生成、骨架分析、BRICS片段化等完整功能,支持...
脑电心电全搞定!NeuroKit2处理生理信号真的绝了🔥研究人必看-Skill优仓

脑电心电全搞定!NeuroKit2处理生理信号真的绝了🔥研究人必看

NeuroKit2是一个Python生理信号处理工具包,覆盖ECG、EEG、EDA、RSP、PPG、EMG、EOG七大信号类型,提供统一的处理接口和完整的HRV分析、复杂度计算、事件相关分析能力。适合心理生理学研究者、...
质谱数据分析不再头疼!pyopenms帮你搞定蛋白质组学全流程,真的绝了🔥-Skill优仓

质谱数据分析不再头疼!pyopenms帮你搞定蛋白质组学全流程,真的绝了🔥

pyopenms是OpenMS库的Python接口,专为LC-MS/MS蛋白质组学和代谢组学数据分析设计。支持mzML、mzXML、mzTab等主流质谱文件格式的读写,提供信号处理、特征检测、肽段鉴定和定量分析全套功能,并...
医学研究人员看过来!Clinical Decision Support自动生成临床决策文档,GRADE分级+生存分析一键搞定🔥-Skill优仓

医学研究人员看过来!Clinical Decision Support自动生成临床决策文档,GRADE分级+生存分析一键搞定🔥

Clinical Decision Support是一个面向制药公司和临床研究人员的专业Skill,支持自动生成患者队列分析报告和治疗推荐报告。内置GRADE证据分级、Kaplan-Meier生存分析、TikZ决策流程图生成,输出...
RAG系统搜索慢到崩溃?Qdrant向量数据库毫秒级召回真的绝了🔥-Skill优仓

RAG系统搜索慢到崩溃?Qdrant向量数据库毫秒级召回真的绝了🔥

Qdrant是一款基于Rust的高性能向量数据库,专为生产级RAG和语义搜索场景设计。支持混合搜索、带过滤的向量召回、INT8量化压缩、分布式分片等企业级特性,完美兼容LangChain、LlamaIndex等主流RA...
训练462B超大模型不再是梦?Megatron-Core在H100上跑出47% MFU,真的绝了🔥-Skill优仓

训练462B超大模型不再是梦?Megatron-Core在H100上跑出47% MFU,真的绝了🔥

Megatron-Core是NVIDIA出品的生产级大语言模型训练框架,支持2B到462B参数规模,在H100上实测达到47% MFU。通过张量并行、流水线并行、专家并行等多维并行策略组合,显著提升GPU利用率并降低显...
ML实验记录全靠手动?Weights & Biases自动追踪训练过程,模型调参效率直接翻倍🚀-Skill优仓

ML实验记录全靠手动?Weights & Biases自动追踪训练过程,模型调参效率直接翻倍🚀

Weights & Biases(W&B)是一个专为ML工程师设计的实验追踪与MLOps平台Skill,支持自动记录训练指标、实时可视化训练曲线、贝叶斯超参数Sweep优化,以及数据集和模型的Artifact版本管理。原生集...