xieliaing
diff --git a/‎.github/workflows/deploy-pages.yml‎
Lines changed: 57 additions & 0 deletions b/‎.github/workflows/deploy-pages.yml‎
Lines changed: 57 additions & 0 deletions
diff --git a/‎.gitignore‎
Lines changed: 2 additions & 0 deletions b/‎.gitignore‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎.vscode/settings.json‎
Lines changed: 4 additions & 0 deletions b/‎.vscode/settings.json‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎README.md‎
Lines changed: 116 additions & 1 deletion b/‎README.md‎
Lines changed: 116 additions & 1 deletion
diff --git a/‎_quarto.yml‎
Lines changed: 101 additions & 0 deletions b/‎_quarto.yml‎
Lines changed: 101 additions & 0 deletions
diff --git a/‎chapters/01 第一章-因果关系入门.ipynb‎
Lines changed: 62 additions & 48 deletions b/‎chapters/01 第一章-因果关系入门.ipynb‎
Lines changed: 62 additions & 48 deletions
diff --git a/‎chapters/02 第二章-随机试验.ipynb‎
Lines changed: 36 additions & 17 deletions b/‎chapters/02 第二章-随机试验.ipynb‎
Lines changed: 36 additions & 17 deletions
@@ -0,0 +1,57 @@
+name: Deploy Quarto site to GitHub Pages
+
+on:
+  push:
+    branches: [main]
+  workflow_dispatch:
+
+permissions:
+  contents: read
+  pages: write
+  id-token: write
+
+concurrency:
+  group: "pages"
+  cancel-in-progress: true
+
+jobs:
+  build:
+    runs-on: ubuntu-latest
+    steps:
+      - name: Checkout
+        uses: actions/checkout@v4
+
+      - name: Setup Python
+        uses: actions/setup-python@v5
+        with:
+          python-version: "3.11"
+
+      - name: Install Python dependencies
+        run: |
+          python -m pip install --upgrade pip
+          pip install -r requirements.txt
+
+      - name: Setup Quarto
+        uses: quarto-dev/quarto-actions/setup@v2
+
+      - name: Render site
+        uses: quarto-dev/quarto-actions/render@v2
+
+      - name: Setup Pages
+        uses: actions/configure-pages@v5
+
+      - name: Upload artifact
+        uses: actions/upload-pages-artifact@v3
+        with:
+          path: docs
+
+  deploy:
+    environment:
+      name: github-pages
+      url: ${{ steps.deployment.outputs.page_url }}
+    runs-on: ubuntu-latest
+    needs: build
+    steps:
+      - name: Deploy to GitHub Pages
+        id: deployment
+        uses: actions/deploy-pages@v4
@@ -0,0 +1,2 @@
+/.quarto/
+**/*.quarto_ipynb
@@ -0,0 +1,4 @@
+{
+    "python-envs.defaultEnvManager": "ms-python.python:conda",
+    "python-envs.defaultPackageManager": "ms-python.python:conda"
+}
@@ -46,4 +46,119 @@
 20 |    第二十章: 即插即用的估计量|   2022-10-10
 21 |    第二十一章: 元学习器|   2022-11-15
 
-该书遵守[MIT License](./LICENSE)。
+该书遵守[MIT License](./LICENSE)。
+
+## 本地运行指南 2026-03-02
+
+### 安装 python 及相关程序
+
+建议使用 **Python 3.10 ~ 3.12**。Windows 用户优先推荐安装 [Miniconda](https://docs.conda.io/en/latest/miniconda.html)，也可以使用官方 Python。
+
+此外建议安装：
+
+- [Git](https://git-scm.com/)
+- [VS Code](https://code.visualstudio.com/)（可选，但推荐）
+- Jupyter（会在下方通过 `pip` 安装）
+
+### 获取项目代码
+
+```bash
+git clone https://github.com/xieliaing/CausalInferenceIntro.git
+cd CausalInferenceIntro
+```
+
+### 创建并激活虚拟环境（推荐）
+
+#### 方案 A：使用 conda（推荐）
+
+```bash
+conda create -n causal-intro python=3.11 -y
+conda activate causal-intro
+```
+
+#### 方案 B：使用 venv
+
+```bash
+python -m venv .venv
+```
+
+Windows PowerShell：
+
+```powershell
+.\.venv\Scripts\Activate.ps1
+```
+
+macOS / Linux：
+
+```bash
+source .venv/bin/activate
+```
+
+### 安装依赖
+
+项目中的 Notebook 主要依赖如下（可先安装最小集合）：
+
+```bash
+pip install -U pip
+pip install jupyter notebook jupyterlab numpy pandas scipy matplotlib seaborn scikit-learn statsmodels linearmodels graphviz
+```
+
+如果你需要运行翻译脚本 `AutoTranslateNotebooks.py`，再额外安装：
+
+```bash
+pip install nbformat googletrans==4.0.0-rc1
+```
+
+或者你可以直接使用如下命令安装本项目所需的依赖项：
+
+```bash
+pip install -r requirements.txt
+```
+
+### 启动并运行 Notebook
+
+在仓库根目录运行：
+
+```bash
+jupyter lab
+```
+
+或：
+
+```bash
+jupyter notebook
+```
+
+然后在浏览器中打开 `chapters/` 目录，按顺序运行对应章节。
+
+### 可选：运行翻译脚本
+
+```bash
+python AutoTranslateNotebooks.py "chapters/01 第一章-因果关系入门.ipynb" "chapters/01 第一章-因果关系入门_机器翻译.ipynb"
+```
+
+说明：
+
+- 第 1 个参数是输入 Notebook
+- 第 2 个参数是输出 Notebook
+- 若出现翻译 API 报错，请稍后重试或更换网络环境
+
+### 常见问题
+
+1. **命令找不到（python / pip / jupyter）**
+	- 请确认已激活虚拟环境，或将 Python 加入 PATH。
+
+2. **PowerShell 无法激活 venv**
+	- 可临时执行：
+	```powershell
+	Set-ExecutionPolicy -Scope Process -ExecutionPolicy Bypass
+	```
+
+3. **Notebook 打开后缺包报错**
+	- 在当前环境补装缺失包，例如：
+	```bash
+	pip install <package_name>
+	```
+
+4. **图形模型相关章节绘图失败**
+	- 请确认本机已安装 Graphviz 程序，并将其加入系统 PATH。
@@ -0,0 +1,101 @@
+project:
+  type: website
+  output-dir: docs
+
+website:
+  title: "因果推断：从概念到实践"
+  description: "《Causal Inference for the Brave and True》中文翻译与示例站点。"
+  repo-url: https://github.com/pumc-zhou/CausalInferenceIntro
+  repo-actions: [source, issue]
+  page-navigation: true
+  navbar:
+    pinned: true
+    left:
+      - href: index.qmd
+        text: 首页
+    right:
+      - href: https://github.com/pumc-zhou/CausalInferenceIntro
+        text: GitHub
+      - href: https://github.com/matheusfacure/python-causality-handbook
+        text: 原书
+  sidebar:
+    style: docked
+    search: true
+    collapse-level: 2
+    contents:
+      - section: "章节"
+        contents:
+          - href: chapters/01 第一章-因果关系入门.ipynb
+            text: "第一章: 因果关系入门"
+          - href: chapters/02 第二章-随机试验.ipynb
+            text: "第二章: 随机试验"
+          - href: chapters/03 第三章 统计学回顾：最危险的公式.ipynb
+            text: "第三章: 统计学回顾"
+          - href: chapters/04 第四章 图因果模型.ipynb
+            text: "第四章: 图因果模型"
+          - href: chapters/05 第五章 线性回归超乎寻常的有效性.ipynb
+            text: "第五章: 线性回归的有效性"
+          - href: chapters/06 第六章 分组和虚拟变量.ipynb
+            text: "第六章: 分组和虚拟变量"
+          - href: chapters/07 第七章 控制混淆因素之外的考虑.ipynb
+            text: "第七章: 控制混淆之外"
+          - href: chapters/08 第八章 工具变量.ipynb
+            text: "第八章: 工具变量"
+          - href: chapters/09 第九章 非服从性与局部平均效应.ipynb
+            text: "第九章: 非服从性与 LATE"
+          - href: chapters/10 第十章 匹配.ipynb
+            text: "第十章: 匹配"
+          - href: chapters/11 第十一章 倾向得分.ipynb
+            text: "第十一章: 倾向得分"
+          - href: chapters/12 第十二章 双重稳健估计.ipynb
+            text: "第十二章: 双重稳健估计"
+          - href: chapters/13 第十三章 面板数据与固定效应.ipynb
+            text: "第十三章: 面板数据与固定效应"
+          - href: chapters/14 第十四章 双重差分.ipynb
+            text: "第十四章: 双重差分"
+          - href: chapters/15 第十五章 合成控制.ipynb
+            text: "第十五章: 合成控制"
+          - href: chapters/16 第十六章 断点回归.ipynb
+            text: "第十六章: 断点回归"
+          - href: chapters/17 第十七章 预测模型 101.ipynb
+            text: "第十七章: 预测模型 101"
+          - href: chapters/18 第十八章 异质干预效应与个性化.ipynb
+            text: "第十八章: 异质干预效应"
+          - href: chapters/19 第十九章 评估因果模型.ipynb
+            text: "第十九章: 评估因果模型"
+          - href: chapters/20 第二十章 即插即用估计量.ipynb
+            text: "第二十章: 即插即用估计量"
+          - href: chapters/21 第二十一章 元学习器.ipynb
+            text: "第二十一章: 元学习器"
+  page-footer:
+    left: "内容基于《Causal Inference for the Brave and True》中文翻译整理。"
+    center: "Power by Quarto"
+    right: "[GitHub 仓库](https://github.com/pumc-zhou/CausalInferenceIntro)"
+
+format:
+  html:
+    theme: cosmo
+    css: styles.css
+    page-layout: article
+    smooth-scroll: true
+    toc: true
+    toc-location: right
+    toc-title: 本页目录
+    toc-expand: 2
+    toc-depth: 3
+    code-copy: true
+    anchor-sections: true
+    link-external-newwindow: true
+    grid:
+      body-width: 980px
+      sidebar-width: 300px
+      margin-width: 220px
+    lang: zh-CN
+
+execute:
+  freeze: auto
+
+render:
+  - index.qmd
+  - chapters/*.ipynb
+  - "!chapters/.ipynb_checkpoints/**"
@@ -4,42 +4,61 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "# 02 - 随机实验\n",
-    "\n",
+    "---\n",
+    "title: \"第二章: 随机试验\"\n",
+    "date: \"2026-03-02\"\n",
+    "jupyter: python3\n",
+    "author: \"CausalInferenceIntro\"\n",
+    "lang: zh-CN\n",
+    "execute:\n",
+    "  echo: true\n",
+    "  warning: false\n",
+    "format:\n",
+    "  html:\n",
+    "    toc: true\n",
+    "    toc-depth: 3\n",
+    "    code-fold: false\n",
+    "---\n"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
     "## 黄金标准\n",
     "\n",
     "在上一节中，我们看到了关联关系与因果关系为什么不同。我们还看到了使关联成为因果关系所需的条件。\n",
     "\n",
-    "$\n",
+    "$$\n",
     "E[Y|T=1] - E[Y|T=0] = \\underbrace{E[Y_1 - Y_0|T=1]}_{ATT} + \\underbrace{\\{ E[Y_0|T=1] - E[Y_0|T=0] \\}}_{BIAS}\n",
-    "$\n",
+    "$$\n",
     "\n",
     "\n",
-    "回顾一下，如果没有偏差，关联就会变成因果关系。如果 \\\\(E[Y_0|T=0]=E[Y_0|T=1]\\\\)，就不会有偏差。换句话说，如果干预组和对照组相同或具有可比性，除了他们接受的干预外，关联将是因果关系。或者，用更专业的话说，当未处理的结果等于处理的反事实结果时。请记住，如果他们没有接受干预，这个反事实结果将是干预组的结果。\n",
+    "回顾一下，如果没有偏差，关联就会变成因果关系。如果 $E[Y_0|T=0]=E[Y_0|T=1]$，就不会有偏差。换句话说，如果干预组和对照组相同或具有可比性，除了他们接受的干预外，关联将是因果关系。或者，用更专业的话说，当未处理的结果等于处理的反事实结果时。请记住，如果他们没有接受干预，这个反事实结果将是干预组的结果。\n",
     "\n",
     "我认为我们在使用数学解释如何使关联等于因果关系方面做得还不错。但这只是个理论。现在，我们来看看我们必须使偏差消失的第一个工具：**随机实验**。随机实验包括将群体中的个体随机分配到干预组或对照组。接受干预的比例不必是 50%。您可以进行一个实验，其中只有 10% 的样本得到处理。\n",
     "\n",
     "随机化通过使潜在结果独立于干预来消除偏见。\n",
     "\n",
-    "$\n",
+    "$$\n",
     "(Y_0, Y_1) \\perp\\!\\!\\!\\perp T\n",
-    "$\n",
+    "$$\n",
     "\n",
-    "起初这可能会令人困惑（至少对我来说）。不过别担心，勇敢而真诚的伙伴，我会进一步解释的。如果结果与干预无关，这是否也意味着干预没有效果？嗯，是！但请注意，我不是在谈论结果。相反，我在谈论**潜在**结果。潜在的结果是在干预 (\\\\(Y_1\\\\)) 或控制 (\\\\(Y_0\\\\)) 下结果  **本来**会是怎样的。在随机试验中，我们**不**希望结果**独立**于干预，因为我们认为**干预会导致**结果。但我们希望**潜在**结果独立于干预。\n",
+    "起初这可能会令人困惑（至少对我来说）。不过别担心，勇敢而真诚的伙伴，我会进一步解释的。如果结果与干预无关，这是否也意味着干预没有效果？嗯，是！但请注意，我不是在谈论结果。相反，我在谈论**潜在**结果。潜在的结果是在干预 ($Y_1$) 或控制 ($Y_0$) 下结果  **本来**会是怎样的。在随机试验中，我们**不**希望结果**独立**于干预，因为我们认为**干预会导致**结果。但我们希望**潜在**结果独立于干预。\n",
     "\n",
     "![img](./data/img/rct/indep.png)\n",
     "\n",
-    "说潜在的结果独立于干预是说它们在预期中在干预组或对照组中是相同的。简单来说，这意味着干预组和对照组具有可比性。或者知道干预分配并没有给我任何关于干预前结果如何的信息。因此，\\\\((Y_0, Y_1)\\perp T\\\\) 意味着干预是唯一在干预和对照中产生结果差异的因素。要看到这一点，请注意独立性恰好意味着\n",
+    "说潜在的结果独立于干预是说它们在预期中在干预组或对照组中是相同的。简单来说，这意味着干预组和对照组具有可比性。或者知道干预分配并没有给我任何关于干预前结果如何的信息。因此，$(Y_0, Y_1)\\perp T$ 意味着干预是唯一在干预和对照中产生结果差异的因素。要看到这一点，请注意独立性恰好意味着\n",
     "\n",
-    "$\n",
+    "$$\n",
     "E[Y_0|T=0]=E[Y_0|T=1]=E[Y_0]\n",
-    "$\n",
+    "$$\n",
     "\n",
     "正如我们所见，这使得\n",
     "\n",
-    "$\n",
+    "$$\n",
     "E[Y|T=1] - E[Y|T=0] = E[Y_1 - Y_0]=ATE\n",
-    "$\n",
+    "$$\n",
     "\n",
     "因此，随机化为我们提供了一种在干预和控制之间使用简单差异的方法，并将其称为干预效果。\n",
     "\n",
@@ -50,15 +69,15 @@
     "\n",
     "危机发生四个月后，许多人想知道引入的更改是否可以维持。毫无疑问，在线学习有其好处。这一次，它更便宜，因为它可以节省房地产和交通费用。它也可以更加数字化，利用来自世界各地的世界一流内容，而不仅仅是来自固定教师。尽管如此，我们仍然需要回答在线学习对学生的学习成绩是否有负面或正面影响。\n",
     "\n",
-    "回答这个问题的一种方法是将主要提供在线课程的学校的学生与在传统课堂上授课的学校的学生进行比较。正如我们现在所知，这不是最好的方法。可能是在线学校只吸引纪律严明、成绩高于平均水平的学生，即使课堂表现出色。在这种情况下，我们将有一个正偏差，其中接受干预的学生在学业上比未接受干预的要好：\\\\(E[Y_0|T=1] > E[Y_0|T=0]\\\\)。\n",
+    "回答这个问题的一种方法是将主要提供在线课程的学校的学生与在传统课堂上授课的学校的学生进行比较。正如我们现在所知，这不是最好的方法。可能是在线学校只吸引纪律严明、成绩高于平均水平的学生，即使课堂表现出色。在这种情况下，我们将有一个正偏差，其中接受干预的学生在学业上比未接受干预的要好：$E[Y_0|T=1] > E[Y_0|T=0]$。\n",
     "\n",
-    "或者，另一方面，可能是在线课程更便宜，并且主要由不太富裕的学生组成，他们可能除了学习之外还需要工作。在这种情况下，这些学生即使参加了预科班，也会比预科学校的学生表现更差。如果是这种情况，我们就会偏向另一个方向，即接受干预的学生在学业上比未接受干预的学生更差：\\\\(E[Y_0|T=1] < E[Y_0|T=0]\\\\)。\n",
+    "或者，另一方面，可能是在线课程更便宜，并且主要由不太富裕的学生组成，他们可能除了学习之外还需要工作。在这种情况下，这些学生即使参加了预科班，也会比预科学校的学生表现更差。如果是这种情况，我们就会偏向另一个方向，即接受干预的学生在学业上比未接受干预的学生更差：$E[Y_0|T=1] < E[Y_0|T=0]$。\n",
     "\n",
     "所以，虽然我们可以做简单的比较，但不会很有说服力。无论如何，我们永远无法确定是否有任何偏见潜伏并掩盖了我们的因果关系。\n",
     "\n",
     "![img](./data/img/rct/lurking_bias.png)\n",
     "\n",
-    "为了解决这个问题，我们需要使处理过和未处理过的具有可比性 \\\\(E[Y_0|T=1] = E[Y_0|T=0]\\\\)。 强制执行此操作的一种方法是将在线课程和演示课程随机分配给学生。 如果我们设法做到这一点，除了他们接受的干预外，是否干预不同场景下的平均情况相同。\n",
+    "为了解决这个问题，我们需要使处理过和未处理过的具有可比性 $E[Y_0|T=1] = E[Y_0|T=0]$。 强制执行此操作的一种方法是将在线课程和演示课程随机分配给学生。 如果我们设法做到这一点，除了他们接受的干预外，是否干预不同场景下的平均情况相同。\n",
     "\n",
     "幸运的是，一些经济学家已经为我们做到了这一点。 他们将班级随机化，这样一些学生被分配到面对面的讲座，其他人只进行在线讲座，而第三组则进行在线和面对面讲座的混合形式。 在学期末，他们收集了标准考试的数据。\n",
     "\n",
@@ -346,7 +365,7 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "是的。就这么简单。我们可以看到面对面课程的平均得分为 78.54，而在线课程的平均得分为 73.63。对于在线学习的支持者来说，这不是个好消息。因此，在线课程的 \\\\(ATE\\\\) 为 -4.91。这意味着**在线课程会导致学生的平均成绩降低约 5 分**。就是这样。您不必担心在线课程可能有负担不起面对面课程的贫困学生，或者就此而言，您不必担心来自不同干预方法的学生在任何方面都有所不同他们接受的干预。根据设计，随机实验旨在消除这些差异。\n",
+    "是的。就这么简单。我们可以看到面对面课程的平均得分为 78.54，而在线课程的平均得分为 73.63。对于在线学习的支持者来说，这不是个好消息。因此，在线课程的 $ATE$ 为 -4.91。这意味着**在线课程会导致学生的平均成绩降低约 5 分**。就是这样。您不必担心在线课程可能有负担不起面对面课程的贫困学生，或者就此而言，您不必担心来自不同干预方法的学生在任何方面都有所不同他们接受的干预。根据设计，随机实验旨在消除这些差异。\n",
     "\n",
     "出于这个原因，一个很好的健全性检查以查看随机化是否正确（或者您是否正在查看正确的数据）是检查干预前变量中的干预变量是否等于未干预变量。在我们的数据中，我们有关于性别和种族的信息，因此我们可以查看它们在不同群体中是否平等。对于 `gender`、`asian`、`hispanic` 和 `white` 变量，我们可以说它们看起来非常相似。然而，`black` 变量看起来有点不同。这引起了人们对小数据集会发生什么的关注。即使在随机化的情况下，也可能是偶然地，一组与另一组不同。在大样本中，这种差异趋于消失。\n",
     "\n",
-Original file line number
+Diff line change
@@ @@ -0,0 +1,4 @@ @@
 +{
 +    "python-envs.defaultEnvManager": "ms-python.python:conda",
 +    "python-envs.defaultPackageManager": "ms-python.python:conda"
 +}