tag 标签: 微调

相关博文
  • 热度 15
    2013-1-31 18:00
    1499 次阅读|
    0 个评论
      作者:Soufiane Bendaoud,德州仪器 (TI) 业务拓展经理   摘要 在精密测量过程中,系统工程师们面临的第一个挑战便是如何选择具备最佳性能的运算放大器以及安装在其周围的其他组件。这项工作很重要。在一些有空间限制的应用中,工程师们常常会寻求体积最小的封装,但是这种小型封装具有一定的优势却无法提供理想的精度。本文讨论 IC 制造商用于克服精度挑战的一些技术,并让读者更好地理解封装前和封装后用于获得最佳性能的各种方法,甚至是使用最小体积的封装。   高精确模拟定义 工程师对于运算放大器 (op amps) 精度的定义并不一样,其主要取决于不同的应用。在面对十多家厂商提供的数万件放大器时,工程师常常面临如何选出最佳性能的放大器的难题。也就是说,最高性价比——假设系统还需要其他组件。例如,石油勘探或者地震研究的震动分析应用,要求放大器拥有非常低的输入偏移电压,并且在长时间使用和温度变化的情况下具有非常小的偏差漂移。只有这样,才能保证对数字化信号的影响降至最小。换句话就是说,低噪声、高精度的运算放大器不会严重影响高分辨率数据转换器的性能,从而提供更高的精准度。相反,血糖监测仪通常对偏移和温度偏差漂移的要求则要低得多。   图 1 便携式震动仪的典型结构图     图 2   血糖监测仪的典型结构图   大多数半导体公司都会在运算放大器精度的定义术语方面取得一致意见。实际上,他们会对其进行分组。一般而言,如果运算放大器的初始偏移电压低于 1mV 且单位增益频宽小于 50 MHz,则按照精度来进行分组。但是,这种精度与工艺技术有关,即使在相同器件中也是如此。根据不同的封装,两条不同规格的生产线生产出 同一种放大器的情况并不常见。这是因为,更小的封装更容易受到挤压裸片的封装模塑的应力。   过去,双极输入器件在精度方面领先。尽管一些人认为这些器件仍然是最佳选择(在许多方面它们的确如此),但是最近的一些 CMOS 和 JFET 设计取得了巨大的进步。OPA140 便是一个 JFET 输入放大器的一个例子,它拥有 120 uV 的最大偏移电压,并且在更大的工业温度范围其偏差漂移仅为 1 uV/°C。   在不斩波的情况下实现高精度   和系统工程师一样,IC 设计人员使用各种 IC 级技术,以实现高精度。IC 设计人员实现这种精度的一种方法是使用斩波器稳定实现,也可单独或者联合实现自动归零。尽管这些技术非常有效,但是其存在一些缺点,而这些缺点让放大器在一些应用中的表现不让人满意。为了解决这个问题,许多制造厂商都提供了一些 IC 级修整方法,以获得更低的偏移电压。这种方法反过来又提高了温度变化偏差漂移性能。但是,并非所有修整方法都拥有这种优点。一些修整方法可能并不适合于面向成本敏感性应用的设计。一般情况下,一旦定义了产品并且明确了目标应用以后,便可选定实现高精度的方法。   修整还是不修整   一种最为古老的修整方法是“齐纳去除法 (Zener-zapping)”。去过,许多精密放大器都使用了这种方法。一般而言,这种方法应用于大尺寸处理器,而诸如 CMOS 这样的小型处理器使用这种方法时,成本效益较低。“齐纳去除法”是一种片上处理技术。尽管可以获得非常高的精度,但它通常要求更大的裸片面积,这让它难以适用于小型封装。 激光修整是精密器件中普遍使用的一种方法,其具有许多优点,例如:测试用焊点更少、连接修整成本更低。这种方法广泛用于差分和测量放大器,目的是改善电阻器匹配度,以及提供必要的共模抑制比 (CMRR)。但是,这种方法缺少装配后修整的能力。   EEPROM 是我们能够使用的另一种片上方法,但很少用于独立放大器,因为这种方法通常要求更多的引脚和屏蔽。   由于对精度的需求不断增加,许多制造厂商现在会提供装配后修整功能。这种多晶硅保险丝熔断技术不需要额外的引脚或者测试用焊点,并且相比封装修整方法可以节省大量的成本。这是一种真正意义上的技术突破,因为许多 CMOS 放大器现在都可以达到史无前例的DC精度水平,也即百微伏以下的初始偏移和一微伏以下的偏差漂移。OPA376 是一款具有 25 μV 保证偏移电压的 CMOS 输入放大器,也可以受益于这些 DC 参数。装配后修整让广大 IC 设计人员和布局工程师,可以克服小封装中产生的机械应力,从而拥有小型化的优异精度。除节省成本以外,CMOS 使用这种方法,还让更低电压的使用成为现实。更低电压的电源,让用户拥有更长的电池工作时间(便携式应用的基本要求),并帮助节省高密度电路板的功耗,同时还提供了一种逻辑器件和微控制器的简单接口。   表 1 概括了各种修整方法,并根据技术和制造厂商按照装配前和装配后对其进行分类。     表 1 修整方法总结   根据修整方法选择精度   根据修整方法选择放大器的精度具有一定的误导性。有时,我们在某个具体修整点完成装配后修整。为了保持最低偏移和温度漂移,设计可能会要求使用更多的复杂电路,其给芯片增加了大量基板面。查看数据表单规格表首页以后的内容,了解偏移实际值及其共模变化情况,不要依赖于修整算法。   一些制造厂商利用精密器件的成功,推出非修整版本,其可应用于不同的应用。由于成本被轻松地降低了,这种做法对 IC 厂商和客户都大有好处。   参考文献   如欲下载 OPA376 产品说明书,敬请访问:http://www.ti.com.cn/product/cn/opa376。 如欲了解 TI 运算放大器的更多详情,敬请访问:http://www.ti.com.cn/lsds/ti_zh/analog/amplifiersandlinears/amplifiersandlinears.page。   作者简介   Soufiane Bendaoud 现任 TI 高精度模拟产品部业务开发经理。iSoufiane 毕业于美国加州旧金山州立大学,获电子工程理学士学位,后又毕业于旧金山大学,获 MBA。。 
相关资源
  • 所需E币: 0
    时间: 2024-10-21 11:13
    大小: 3.7KB
    上传者: huangyasir1990
    一、Llama3大模型是什么?Llama是由Meta的人工智能研究团队开发并开源的大型语言模型(LLM),继Llama2+模型之后,Meta进一步推出了性能更卓越的MetaLlama3系列语言模型,包括一个80亿参数模型和一个700亿参数模型。Llama370B的性能美Gemini1.5Pro,全面超越Claude大杯,而400B+的模型则有望与Claude超大杯和新版GPT-4Turbo掰手腕二、llama2和llama3有什么区别?llama3与llama2的模型架构完全相同,只是model的一些配置(主要是维度)有些不同,llama2推理的工程基本可以无缝支持llama3。在meta官方的代码库,模型计算部分的代码是一模一样的,也就是主干decoderonly,用到了RoPE、SwiGLU、GQA等具体技术。通过对比huggingface模型中的config.json,首先可以看出,模型都是LlamaForCausalLM这个类,模型结构不变。三、Llama3的目标和最佳表现Llama3拥抱开源社区。通过不断响应用户反馈来提升模型效果,并且持续在负责任的AI领域扮演重要角色。近期发布的基于文本的模型是Llama3集合的一部分。未来的目标是使Llama3成为多语言、多模态、长上下文、持续提升核心能力,如:推理和代码生成。得益于pretraining和post-training的改进,我们的pretrained模型和instruction-fine-tuned模型是8B和70B最好的大模型。post-training的改进包括:降低误拒率、改进的对齐方法、模型回答的多样性。同时,我们也看到Llama3综合能力的提升,如:推理、代码生成、指令遵循。这使得Llama3更加可控。四、从头构建LLaMA3大模型(Python)首先是模型架构的选择。原工作用的是GPTNeo架构(可以看他们的config),这个算是很老的模型了,最初是EleutherAI用来复现追踪GPT-3的工作的,现在用的也比较少了。我打算选用LLaMA架构,也算是符合研究主流、便于推广。LLaMA3主要多了个GQA,也是现在模型的主流,我这里也用一下。其次是数据的选择。既然是复现,就直接贯彻拿来主义,用原工作开源的数据集(主要是从头生成要花不少api费用)。原工作第一版的时候用的是GPT-3.5生成的数据,后面社区有人更新了第二版,是用GPT-4生成的,比原数据更好,就用它了。最后是训练。其实我手上就两张306012G和4060Ti16G,训这个确实是绰绰有余,但我还是不想在桌前吵我自己,于是继续用Colab。现在Colab可以直接看到剩余使用时长了,虽然已经被砍到只有3h左右的用卡时间,但至少心里有个底,况且3h训我们这个也完全够了。五、用户与LlaMA3进行交互的方式主要分为6个阶段。阶段1:通过按原样使用模型,以适应广泛的应用场景。第2阶段:在用户自定义的应用程序中使用模型。第3阶段:使用提示工程来训练模型,以产生所需的输出。第4阶段:在用户端使用提示工程,同时深入研究数据检索和微调,这仍然主要由LLM提供商管理。第5阶段:把大部分事情掌握在自己(用户)手中,从提示工程到数据检索和微调(RAG模型、PEFT模型等)等诸多任务。第6阶段:从头开始创建整个基础模型——从训练前到训练后。为了最大限度地利用这些模型,建议最好的方法是使用上面的第5阶段,因为灵活性很大程度上取决于用户自身。能够根据领域需求定制模型对于最大限度地提高其收益至关重要。因此,如果不参与到系统开发中,是不能产生最佳回报的。
  • 所需E币: 5
    时间: 2020-4-7 15:47
    大小: 1.75MB
    上传者: rdg1993
    陶瓷天线微调手则简体中文版陶瓷天线微调手则目前GPS业界最常使用的陶瓷天线有两种,分别为偏心馈入式及中心馈入式陶瓷天线,这两种形式的天线是以馈入点位置作区别,所谓的偏心馈入其馈入点位置在陶瓷天线正中心偏一角的对角在线(如Fig-1所示),而中心馈入式天线其馈入位置并非在其正中心,它是在正中心往上移一点的位置(如Fig-2所示)。因GPS卫星为所使用的发射天线为右旋圆极化(RHCP)天线,为使待接收的GPS装置能顺利接收卫星讯号,因此通常在设计接收天线时会使用相同的右旋极化结构来设计,如Fig-1(a)、Fig-2(a)皆为右旋极化结构。左旋极化结构如Fig-1(b)、Fig-2(b)所示。Fig-1,偏心馈入式陶瓷天线Fig-2,中心馈入式陶瓷天线■偏心馈入式陶瓷天线Fig-3此馈入方式是藉由两互相垂直的模态(Lx及Ly)其共振长度的些微差异(Lx≠Ly)所形成圆极化辐射波,若Lx>Ly,此为右旋圆极化天线(RHCPantenna);反之,若LxLy,故Lx为低频模态(fL),Ly为高频模态(fH)。如图Fig-4所示,由ReturnLoss可看出其两模态位置,fL频率为marker-2,fH频率为marker-3,其圆极化中心频率为marker-1,须特别注意圆极化中心频率为SmithChart两模态所相交的尖点,并非ReturnLoss的最低点。而微调的方式可分为削边、挖槽缝及截角三种方式,其操作方式如下叙述。Fig-41、削边微调Fig-51.1削边Cut-X对照Fig-5,将Cut-X……