pss免费字体设计 Stata软件最新版本15款最全功能介绍分享
Stata 15于2017年6月正式发布,这是Stata历史上最大的版本更新。我们发布了 Statalist 并列出了 16 个最重要的新功能。本文将重点介绍这些新功能:
Ÿ扩展回归模型
Ÿ潜在类别分析(LCA)
Ÿ贝叶斯前缀指令
Ÿ线性动态随机一般均衡(DSGE)模型
Ÿweb的动态Markdown文档
Ÿ非线性混合效应模型
Ÿ空间自回归模型(SAR)
Ÿ区间删失参数生存时间模型
Ÿ有限混合模型(FMM)
Ÿ混合Logit模型
Ÿ非参数回归
Ÿ聚类随机设计和回归模型的功效分析
ŸWord和PDF文档
Ÿ图形颜色透明度/不透明度
ŸICD-10-CM/PCS支持
Ÿ美联储经济数据(FRED)支持
Ÿ其他
1. 扩展回归模型
我们将其称为 ERMS 扩展回归模型。四个新命令适用于
.线性回归分析,
.区间回归包括tobit模型,
。可能性,
.有序概率模型
可以任意组合成:
.内生变量
.非随机处理任务
.内源性(赫克曼式)样本选择
这些新命令令人惊讶,因为它们允许您向任何方程添加内生变量,包括处理分配和概率选择方程。内生变量不仅限于连续性。它们可以是二进制的或序数的。无论是外源性还是内源性,它们都可以与其他变量相互作用。它们甚至可以相互作用形成平方项或立方项!
这些新的 ERM 命令(eregress、eintreg、eprobit 和 eoprobit)注定会变得流行,因为它们为研究人员解决了许多问题。首先,可能存在内生变量,因为许多模型省略了与模型中的变量相关的变量。其次,数据经常被剪枝,而且剪枝不是随机的。 ERM 样本选择选项允许您对选择过程进行建模并对其进行调整。或者,如果您使用非随机治疗效果模型,则可以使用 ERM 来处理分配选项。或者,可以组合治疗分配和选择选项,其中一些选项由于拟合的内源治疗分配模型中的后续行为而丢失。
语法非常简单:
Eregress 适用于线性回归。概率模型可以很容易地拟合到线性回归模型。如果结果变量 y 是二进制的,则输入:
如果结果变量 y 是连续的,但变量 x2 是二进制的,则输入
如果 y 和 x2 都是二进制,请输入
如果你想了解奇怪的 nomain 选项的详细信息。当指定 endogenous(name=…) 时,变量名称会自动添加到主方程中。可以打字
或者
不管怎样,同一个型号就可以了。前面的示例中指定了 Nomain,因此我不需要解释此选项以包含主方程 X2。
2. 潜在类别分析(LCA)
潜在的平均值是不可观察的。分类也称为分组。潜在类别是数据中未观察到的组。您可能拥有有关消费者的数据,并根据他们对产品的潜在兴趣将他们分为三组。但是,数据中没有变量指定每个消费者所属的组。如果有四个二进制变量指示消费者所属的底层类,您可以输入
观察 y1、y2、y3 和 y4。 Consum 是潜在的分类变量,lclass(Consum 3) 指定为值 3。结果是模型拟合,其中 y1、y2、y3 和 y4 由未观察到的类确定。使用四个 y 变量之一和三个类别之一,该命令适合 4×3 = 12 逻辑回归分析。每个回归都有一个截距。此外,多项式逻辑回归也可以用来预测Consum。
拟合模型后,您可以
.使用新的estat lcprob命令来估计属于每个类别的消费者比例;
.使用新的estat lcprob命令估计每个类中Y1、Y2、Y3和Y4的边际均值(均值是示例中显示的概率);
.使用新的estat lcprob命令来评估适应度;
使用现有的预测命令来获取类成员的预测概率和观察到的结果变量的预测值。
3.贝叶斯前缀说明
新的 bayes: prefix 命令使您能够比以前的版本适应更广泛的贝叶斯模型。以前可以拟合贝叶斯线性回归,但现在只需输入文本即可:
这非常方便。以前不可能拟合贝叶斯生存模型。现在您可以:
甚至可以拟合贝叶斯多级生存模型:
在此模型中,为变量 id 的每个值添加随机截距。
新的 bayes: prefix 命令在许多 Stata 评估命令之前运行,并提供 50 多种可能的模型。支持的模型包括多层次、面板数据、生存和样本选择模型!
新命令支持 Stata 的所有贝叶斯功能。您可以从以前的模型参数分布中进行选择,也可以使用以前的默认值。当封闭式解决方案与吉布斯方法一起使用时,可以使用默认的自适应 Metropolis-Hastings 采样或吉布斯采样,或两种方法的组合。 STATA 的任何其他功能都可以在 bayesmh 命令之上使用。回归系数的默认先验分布可以更改,例如使用prior()选项:
评估后pss免费字体设计,可以使用Stata的标准贝叶斯后估计工具,例如
。贝叶斯图检查收敛性
。 bayesstats 汇总函数来估计模型参数
。 bayesstats ic 和 bayestest 模型计算贝叶斯因子并比较贝叶斯模型
。用于区间假设检验的 bayestest 区间
4. 线性动态随机一般均衡(DSGE)模型
DSGE是经济学中的时间序列模型。它们是传统预测模型的替代品。两者都试图解释一般经济现象,但 DSGE 允许在经济理论衍生的模型的基础上做到这一点。有许多基于经济理论的方程。这些方程的主要特征是未来变量的预期值会影响今天的变量。这是 DSGE 与向量回归或状态空间模型的区别的属性。另一个特点是从理论推导出来的参数通常可以用该理论来解释。
以下是如何在 Stata 中拟合二方程 DSGE 模型。大括号 {} 用于括起参数:
p 是控制变量,y 是状态空间术语中的状态变量。 f.是前向算子。
第一个方程,
表示控制变量 p 取决于未来的 {beta}*p 加上当前的 {kappa}*y。
第二个方程,
表示 y 的预期未来值为 {rho}*y。 stata 选项指定 y 是状态变量。
DSGE模型共有三个变量:
控制变量和方程(例如 p)没有影响,由方程组确定。
.状态变量(例如 y)具有在时间段开始时预先确定的隐式冲击。
.冲击是驱动系统中的随机错误。
无论如何,上面的 dsge 命令可以定义一个模型并拟合它。
如果我们对 beta 和 kappa 之间的关系有一个理论,使得它们相等,我们可以使用现有的命令 test 来测试它。
新的后估计命令 estat 策略和 estat 转换报告策略和转换矩阵。如果您输入
将控制变量显示为状态变量的线性函数。如果有五个控制变量和三个状态变量,则每个控制将报告为三个状态的线性函数。在上面的简单示例中,预测 p 的线性函数现在将显示为 y 的函数。
同时,
报告变换矩阵。策略矩阵将 p 报告为函数 y,而转换矩阵则报告 y 如何随时间演变为 p。可以使用 Stata 现有的预测命令生成预测。脉冲响应函数可以使用 Stata 现有的 irf 命令来绘制。
这是脉冲响应图:
5.Web动态Markdown文档
你听说过 Markdown 吗?这是创建 html 文档的流行方式。 html 文件很麻烦。 Markdown 简单直观,想法也简单。您可以创建一个包含所需人类可读格式文本的文件,然后通过该文件运行命令来创建 HTML 文件。
Stata 现在支持 Markdown,并且我们向 Markdown 添加了标签(函数),允许在输入文件中包含 Stata 命令。您包含的命令将运行并显示,或秘密运行,并提取部分输出以供文档使用。
您可以创建一个文件,例如
在 Stata 中,您可以输入
现在,您有一个名为 example.html 的新文件,在网络上,该文件如下所示:
dyndoc 代表动态文档。创建的 Markdown 文件是动态的,如果数据发生变化,您可以通过简单的输入重新创建网页。
6. 非线性混合效应模型
非线性混合效应模型也称为非线性多级模型和非线性分层模型。这些模型可以用两种方式来思考。它们可以被认为是包含随机效应的非线性模型。或者它们可以被认为是线性混合效应模型,其中部分或全部固定和随机效应是非线性的。无论哪种方式,总误差分布都被假定为高斯分布。
这些模型在群体药代动力学、生物测定以及研究生物和农业生长过程中很受欢迎。例如,非线性混合效应模型被用来模拟人体的药物吸收、地震烈度和植物生长。
新的评估命令名为 menl。它实现了实践中流行的 Lindstrom-Bates 算法,该算法基于固定和随机效应的非线性均值函数的线性化。支持最大似然和受限最大似然估计方法。 Menl 易于使用。可以直接输入各个方程。大括号 { } 用于括起要匹配的参数:
估值为 b1、b2 和 b3。 U[plant] 是每个植物的随机截距。
menl 可以拟合多级或多级规范,其中参数将每个级别定义为模型参数和随机效应函数。
这与之前的模型相同,只是允许 b2 和 b3 在工厂之间有所不同。可以使用多种方差-协方差结构来对同一级别的随机效应的依赖性进行建模。如果要建模,可以在上例中设置U1、U2、U3之间的依赖关系。尽管没有明确说明,但该模型存在组内误差。方差-协方差结构对于异方差性和类内相关性建模非常灵活。异方差可以建模为协变量或预测均值的幂函数,并且依赖性可以使用任何阶的自回归模型进行建模。
除了标准函数之外,后估计特征还包括随机效应及其标准误差的预测、模型中定义的感兴趣参数的预测、作为其他模型参数和随机效应的参数、聚类相关矩阵的整体评估等。
7.空间自回归模型(SAR)
Stata 拟合空间自回归 (SAR) 模型,也称为同时自回归模型。新的 spregress、spivregress 和 spxtregress 命令允许因变量的空间滞后、自变量的空间滞后以及空间自回归误差。空间滞后是时间序列滞后的空间模拟。近年来时间序列滞后成为变量值。空间滞后是附近区域的值。
该模型适用于区域数据,也称为区域数据。观测值称为空间单位,可能是国家、州、地区、县、城市、邮政编码或城市街区,也可能根本不是地理位置。它们可以是社交网络的节点。空间模型评估直接影响(一个区域对其自身的影响)并估计邻近区域的间接或溢出效应。
有一本全新的 [SP] 手册专门介绍 Stata 的新 SAR 功能。这些命令称为 Sp 命令。他们可以与:
。 shapefile 通过网络检索您选择的数据,或者
.Ÿ没有shapefile和数据,只有位置的坐标,或者
.Ÿ如果没有形状文件,则不会出现位置社交网络数据。
以下是它如何与 shapefile 配合使用。访问美国人口普查局网站并下载 tl_2016_us_county 文件。您现在输入
接下来,将新创建的 tl_2016_us.county.dta 文件与您的分析文件合并:
您已准备好定义空间权重矩阵并拟合空间滞后模型。
仅拟合(1)大学(2)因变量的空间滞后和(3)大学空间滞后的失业模型。该模型还存在自回归误差。使用W计算空间滞后变量,使用m计算空间滞后误差。
8. 区间删失参数生存时间模型
Stata新的stintreg命令添加了streg,用于拟合参数生存模型。 termreg 将模型拟合到区间删失数据。在区间删失数据中,失效时间是不确定的。众所周知,受试者在尚未失败时会失败,而在后来失败时则会失败。
tenurereg 拟合指数、Weibull、Gompertz、对数正态分布、对数逻辑和广义伽玛生存时间模型。支持比例风险和加速故障时间措施。特点包括
.分层估计
.灵活的辅助参数建模
。稳健、集群稳健、自举和折刀的标准错误
通过 svy 前缀支持调查数据评估。
除了基本函数外,后估计函数还包括幸存者图、危险函数和累积危险函数;平均时间和中位时间预测; Cox-Snelland 类鞅残值等
9. 有限混合模型(FMM)
新的 fmm:当数据来自未观察到的子群体时,用于拟合模型的前缀命令。它可以与 17 个 Stata 评估命令一起使用。
大多数用户使用fmm来拟合不同子群体之间模型中参数(系数、位置、方差、比例等)的变化。在这些模型中,未观察到的亚群称为类。假设您对拟合模型感兴趣。
但您认为存在三类模型,其参数可能有所不同。虽然没有变量来记录班级成员资格pss免费字体设计,但您可以
该报告将是三个线性回归(每个类别一个)以及预测类别成员资格的模型。
fmm:当类可能遵循不同的模型时,也可以同时使用多个评估命令,例如
在二类示例中,报告将是第一类的线性回归模型、第二类的泊松回归以及预测类成员资格模型。
Postestimation 命令可用于 (1) 估计每个类在总人口中的比例,(2) 报告类内结果变量的边际平均值,(3) 预测类成员资格的概率并预测结果。
10.混合Logit模型
Stata 拟合了多项 Logit 模型。 Stata15 使它们能够拟合混合形式,包括随机系数。
随机系数对于拟合多项式逻辑模型具有特殊意义。他们设想了一种绕过不相关替代方案独立性(IIA)的方法。这个假设表明,如果您选择步行上班,当您的选择是步行、乘坐公共汽车或开车时,您仍然选择步行,即使您没有选择不再可用的选项。如果在步行和开车之间做出选择,您仍然会选择步行。人类有时会有不同的行为。
IIA 假设选择是独立的,以协变量为条件。如果违反此假设,则选择将是相关的。随机系数允许选择相关性。研究人员经常在随机效用模型和离散选择分析中使用混合模型。 Stata 的新 asmixlogit Logit 命令支持各种随机系数分布,并允许模型包含特定于案例的变量。
11.非参数回归
Stata 现在适用于非参数回归。在这些模型中,未指定函数形式。指定变量并指定要匹配的变量:
匹配是g()。该方法不假设 g() 是线性的;它也可以
该方法甚至不假设 g() 在参数中是线性的。它也可以
要将 ay 模型拟合到 x1、x2 和 x3,请输入
报告的是 y、x1、x2 和 x3 的偏导数的平均值以及标准误差。平均值是根据数据计算得出的。拟合模型后,您可以使用predict获取预测值。
平均导数类似于系数,或者至少模型是线性的,但事实并非如此。请注意,非线性模型中的平均导数不是平均导数。您可能想知道 x1、x2 和 x3 在变量均值中的 y 导数。可以使用边距获得:
或者,您希望评估特定兴趣点的预测值,
如果您希望 x3 为 1, 2,..., 10,您可以输入
然后,您可以输入
画出这个函数的一部分。
此外,边距不仅可以计算,还可以生成引导标准误差。
12. 集群随机设计和回归模型的功耗分析
Stata 现有的 power 命令执行样本功率和 (PSS) 分析。其功能包括 PSS 线性回归和集群随机设计 (CRD)。现在可以添加您自己的功效和样本量方法。
线性回归的新方法包括
.power oneslope,在简单线性回归中对斜率测试执行 pss。在给定其他研究参数的情况下计算样本的大小或功效
。 power rsquared,在多元线性回归中执行 R 平方检验的 PSS。 R 平方检验是决定系数(R 平方)的 f 检验。该检验可用于检验所有系数的显着性,也可用于检验其中的一个子集。在这两种情况下,powerrsquared 都会计算样本大小或功效或目标 R 平方到其他研究参数。
.power pcorr,在多元线性回归中执行 PSS 的偏相关测试。偏相关检验是对多重相关系数f的平方的检验。此命令根据其他研究参数计算样本量或功效或目标平方偏相关系数。
Stata 15 现在还支持聚类随机设计:
在 CRD 中,受试者组(簇)是随机的,而不是个体,这意味着样本大小的作用是通过簇的数量和簇大小来发挥的。样本大小确定包括给定簇大小的数量或给定簇的大小。 CRD 命令计算 (1) 簇的数量,(2) 簇的大小,或 (3) 功效,或给定其他参数的最小可检测效应大小。这些命令可以根据不相等的簇大小调整选项。
。当指定新的选项集群时,现有的 5 种电源方法将扩展以支持 CRD。他们是
对于双样本方法,还可以针对两组中不相等的聚类进行调整。
与所有其他幂方法一样,新方法允许为参数指定多个参数值,并自动生成表格和图形结果。
另一个新功能是能够添加您自己的 PSS 方法。这很容易做到。编写一个程序来计算样本量、功效或效应量。电源命令将为您完成剩下的工作。它将处理选项中多个值的支持,并自动生成图表和结果表。
13.Word和PDF文档
现在,使用 Stata 的嵌入结果生成 Word 和 PDF 文件就像创建 Excel 工作表一样简单。大多数用户喜欢 Stata 14 中的 putexcel,如果您是其中之一,您一定会喜欢新的 putpdf 和 putdocx 命令。他们的工作方式就像putexce一样。可以编写 Do 文件来创建包含最新结果、表格和图表的整个 Word 或 PDF 报告。自动生成可重复的报告。
新的 putdocx 命令将段落、图像和表格写入 Word 文档(.docx 文件)。图像包括 Stata 图形和组织的徽标。您还可以设置文本对象的格式。包括字体大小、粗体、斜体、自定义表格等。
14.图形颜色透明度/不透明度
到目前为止,将一个对象绘制在另一个对象之上,上面的对象覆盖下面的对象。用计算机图形术语来说,Stata 颜色是完全不透明的,或者,如果您愿意,也可以不完全透明。 Stata15 允许控制其颜色的不透明度。不透明度指定为百分比。默认情况下,Stata 的颜色是 100% 不透明的。
只要指定颜色,就可以指定不透明度,例如在 mcolor() 选项中控制标记的颜色。您可以指定 green%50 而不是绿色。您可以指定“0 255 0%50”而不是“0 255 0%50”(相当于绿色)。您可以自己指定 %50 以使默认颜色 50% 不透明。
但是,不要指定%0。这是完全透明且不可见的。
这是一个使用 70% 不透明度的图表:
15. ICD-10-CM/PCS 支持
Stata15支持ICD-10-CM和ICD-10-PCS,即NCHS和CMS提供的美国ICD-10代码。 Stata15支持从2016年版本开始(从2015年10月开始)的代码,当时它们被授权在美国使用,并支持所有后续版本。
Stata 于 1998 年开始支持 ICD,从 ICD-9-CM 版本 16 开始,并支持随后的每个 ICD-9 版本。自 2003 年起,Stata 还支持 ICD-10 代码版本。
自 1998 年以来,Stata 的 ICD 命令已经从简单的有效代码和短语的自动列表发展成为 ICD 代码的完整数据管理系统。该系统甚至能够在一个数据集中管理多个 ICD 版本!
16. 美联储经济数据 (FRED) 支持
圣路易斯联邦储备银行向注册用户提供超过 470,000 个美国和国际经济和金融时间序列。注册是免费且简单的。该服务称为 FRED。它包括来自 84 个来源的数据,包括美联储、宾夕法尼亚世界表、欧盟统计局和世界银行。
在 Stata 15 中,您可以使用 Stata 的 GUI 访问和下载 FRED 数据。按类别、出版物或来源搜索或浏览。单击即可选择感兴趣的系列。选择 1 或选择 100。当您单击“下载”时,Stata 将下载它们并将它们组合成一个内存中的自定义数据集。
Stata 命令行界面也提供了这些相同的功能。命令是 import fred。当跟踪需要自动更新 27 个不同系列的月度报告时,此命令非常方便。
Stata 可以访问 FRED 和 ALFRED。 ALFRED是FRED的历史档案数据。
17. 其他