Paper:JarxiV
title: JarviX: A LLM No code Platform for Tabular Data Analysis and Optimizationauthors: Shang-Ching Liu, ShengKun Wang, Wenqi Lin, Chung-Wei Hsiung, Yi-Chen Hsieh, Yu-Ping Cheng, Sian-Hong Luo, Tsungyao Chang, Jianwei Zhangyear: 2023
摘要JarviX提供了一个复杂的数据分析框架,利用LLM促进表格数据集的自动引导和高精度数据分析。提供简洁的数据洞察摘要、提出相关分析问题、有效可视化数据,并为结果提供全面解释。
引言当前研究焦点是各种任务的评估,但缺少为下有应用提供记过话和框架的学术资{1}。大模型能力尚未达到庄家水平{2}。
主要工作:提出一种将LLM用于表格数据分析的全面方法,特别是非专业人员利用LLM进行高级数据分析。
实现:将H2O-AutoML定制的AutoML管道集成。
主要目标:通过微调和AutoML,使用户具备利用LLM进行基于规则的数 ...
2025蛇年 hello
hello 2025蛇年
还是从两个事讲起:自己的事&实验室的事
自己的事:你的生活、爱好、休息日的安排,从更大范围来讲甚至奖学金目标、竞赛参与、科研进度也包括,当然,作为一个博士生,最最重要也是必需你自己完成的事就是论文。
实验室的事:你作为博士生,在完成自己研究需要实验室的帮助,同时在帮助实验室里的工作,比如引导师弟妹解决科研问题、整理材料、技术汇报、参与需求讨论并提出可行性意见。
1. 自己的事作为一个成年人,2025已经是你成年后的第5年,除了学习,你需要进行职业技能储备。
一年两投:对于论文方面,2025投出2篇文章。完成论文开题前准备。
健身锻炼:体重70KG,穿衣显瘦,脱衣有肉。引体向上完成10个以上,从俯卧撑到基础俄挺。
奖学金获取:通过科研成果,评选奖学金。
2. 实验室的事对于导师:完成基础任务(比如材料整理、新生研讨课、专利撰写),对于老师项目上需求,可能需要你出差、项目汇报。
对于项目:你需要有应对甲方压力的能力(比如需求边界讨论、完成期限界定),因为甲方对技术上的问题天然存在不足,提出的需求没有或不存在已有参考,需要根据你自己的调研后给出结论(情况不同 ...
提示词工程
关键词:提示词工程、ChatGPT、吴达恩、Prompt Engineering
提示词工程1,简介。 目的(如何构建大模型应用)
2,前言。主讲人(openai检索插件、教程书)、网络教程(30个完美提示、一次性使用、不是api调用)、提示词最佳实践(总结,推断,转换,展开,LLM构建语言机器人)、大模型分类(基础(预测下一个单词,大量数据)、指令微调(实际场景、遵循指令,基础模型上训练)、改进(RLHF反馈强化学习))、完成任务(领域、语气、知识储备)
3,指南。关键原则(写清晰明确的具体的说明(≠简短、详细完整、分隔符(文本和提示分离,“”“、```、—-、<>、</tag>)、结构化输出(HTML、JSON、XML、Markdown)、特殊情况(输出None)、提供成功示例zero-shot learning)、给予模型思考的时间(思考方式(推理链chain of thought、步骤)、模型自行解决问题))、工具(OpenAI的python库、OpenAI api(秘钥、gpt-3.5-turbo)、Jupyter、Python的Display库(展 ...
序列比对
关键词:生物信息学、序列比对
序列比对1,基于动态规划:最优比对(打分最高的比对方式,矩阵(Match=2,Unmatch=-1),路径(回溯、多条))
2,最长公共子序列LCS:问题(给定x,y两个字符串,找出最长公共子序列及其长度)、公共子序列个数(不连续,个数(得分改变次数),具体字符(得分改变字符))、递归公式(c[i][j],矩阵(匹配+1,Max(左、上)))、
参考资料:
序列比对动态规划矩阵[生物信息学]
动态规划:最长公共子序列问题。讲解
[轻松掌握动态规划]5.最长公共子序列 LCS
深度测评大模型
大模型深度测评1、评价标准。测试数据集:
MMLU:测试语言English、AI基础能力测试,美国教育体系下小学到本科57个学科知识,测试能力先验学习和解决问题。GPT4>ChatGLM4>Gemini Pro
CMMLU:综合性中文评估基准,类似MMLU,主题包括国内九年义务教育到大学高等教育工67个主题,包括具有中国特定答案的任务(驾驶规则、社会基础法规)。BlueLM>通义>GPT-4
C-EVAL:更广泛的综合性中文评估、包括注会、法考、公考、医师资格证等标准考试,中学到大学主流科目。BlueLM>MagecLM>MindGPT>通义千问
superClUE:中文特点的评测基准,例如成语诗歌文学题材创作。GPT-4>文心一言>通义千问>OPPO AndesGPT
参考资料:
万字测评!18个主流大模型深度评测,读懂AI现状【深度模评03】
chatgpt学习
掌握ChatGPT,高效工作:深入理解及实践技巧,避免信息垃圾,精准获取所需。
1 ChatGPT读大量公开文本信息,涌现逻辑思维能力的大语言模型(LLM)
文字、代码、字符(不考虑多模态)的任务
训练文本截止(2021年9月)
无法获取公开知识、未必准确、卸载prompt里(你的想法、背景、爱好它无法感知)
Prompt(触发和引导大语言模型的输入文本)
Prompt Engineering(优化prompt设计,改进回答,不同措辞、详细背景信息)
中文(自然表达、适合中文相关知识和领域,专业领域差),英文(模型表现更好,国际性信息)
1.1 ChatGPT Prompt Engineering实战prompt词的分享网站
1.1.1 Prompt的基础结果指令词(事情)、输入(问题、内容)、背景(上下文信息)、输出要求(格式、长度限制)
猜测(日期、天气、展开对话、文本补充)、输出文本结构范例(提供输入学习、输出要求)
1.1.2 Prompt 技巧设定你的角色(提高相关性和满意度)
设定chatgpt角色(专业角色,老师律师)
明确问题(细化)
提供背景信息(基础信息、现 ...
javaweb学习
“探索Java Web开发:深入SSM框架,记录实战笔记。”
JavaWeb利用java技术开发网站,解决web互联网领域的技术栈
web互联网系统三部分:网页(前端)、数据库通过JavaWeb程序连接(后端)
1. 数据库MySql(DBMS),SQL语言
数据库DB、数据库管理系统DBMS(管理数据库的大型软件)、SQL(结构化查型语言,关系型数据库统一标准)
关系型数据库管理系统:Oracle(收费大型)、MySQL(免费开源中小型)、SQL Server(C# 、.net)、PostgreSQL
1.1 安装MySQL
下载官网(稳定版本5.7.24)
bin(可执行文件)、include(C语言头目录)
配置环境、打开MySQL服务service.msc、net start mysql
MySQL服务器(安装了MySQL的计算机)
设置账号密码mysqladmin -u root password 123456、登录mysqlmysql -uroot -p123456,连接mysqlmysql -uroot -p123456 -h127.0.0.1 -P33 ...
Hexo写博客的正确姿态
博客已经可以访问了,但是不知道如何撰写和发表文章?接下来学习一些写文章需要用到的命令。
step 1:写文章命令写文章首先需要再命令行中通过标题新建文章页面(新建文章保存在博客文件夹目录/source/_posts中),同时如果想丰富博客功能,可以新建其他页面(例如音乐、电影、图册等),使用命令如下:
1234hexo new "postName" --新建文章hexo new page "pageName" -- 新建页面
在文件夹会创建文章页面的md格式文件,打开后就可以自由创作文章内容(强推markdown格式容易上手,其次用html格式),同时也可以对文章元数据(标签、分类等等)进行修改和补充。
ps:不知道md格式是什么?md格式通常指markdown格式,是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的 XHTML(或者HTML)文档。是博客撰写中最常用的命令,推荐使用Typora书写,然后复制在文章页面中。
step 2:新建分类和标签如果需要对文章进行方便的管理,可以设置所属的标签(多个)和 ...
建站历程
时间线
2022-11-05 新增音乐界面 音乐页
使用网页可以实现对于音乐的大多需求了(实际是手机内存不够doge)
2022-11-04 博客样式魔改快照 主页 博客页
样式修改暂告一段落了(绝对不是因为懒doge),确实没时间了T_T
2022-11-03 ICP备案成功
收到了ICP备案号,按要求悬挂在了网页底部。
2022-10-29 申请备案
服务器买了国内的,愣着干嘛,备案呗。。。