GitHub - iniyaa-magesh/Canada-PR-forecasting: Advancing Immigration Forecasting: A Predictive Modeling Framework for Permanent Residency Trends Using Spatiodemographic-Economic Features

This project explores the prediction of future Permanent Residency (PR) admissions to Canada from historical immigration and labor market data sets. The goal is to allow data-informed observations of future trends in PR issuance by province and country of citizenship. We utilized several machine learning regression techniques like Random Forest, XGBoost, and Linear Regression, ultimately stacking them with a Voting Regressor ensemble for more consistent and accurate predictions. The predictions are finally visualized with a Power BI dashboard for ease of interpretability and policy-level recommendations.

Objectives:

Forecast PR counts by province and country of citizenship
Identify patterns and influential features contributing to PR intake
Enable better planning and understanding of Canada’s immigration landscape

Key Components

Data Cleaning and Preprocessing: Merged and refined datasets from multiple sources
Exploratory Data Analysis (EDA): Visualizations to understand trends and relationships

Model Development:

Baseline: Linear Regression
Tree-based models: Random Forest, XGBoost
Final: Voting Regressor (ensemble model)
Performance Evaluation: Metrics used include R², MAE, and RMSE
Dashboard: Power BI dashboard for interactive visualizations

Tools and Libraries

Python (Pandas, NumPy, Scikit-learn, XGBoost, Matplotlib)
Power BI for dashboards
Jupyter Notebook for development and visualization

Datasets Used

IRCC Permanent Residents – Monthly Open Data
Statistics Canada – GDP by Industry
Supporting variables: gender, age, province, immigration category, country of citizenship

Why Ensemble Methods?

Ensemble models such as the Voting Regressor combine multiple algorithms to improve predictive accuracy and reduce variance. Compared to individual models, the ensemble approach showed more consistent and reliable performance across different prediction tasks.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
AgeCategory_PR_People.xlsx		AgeCategory_PR_People.xlsx
Country_of_Citizen_Forecasted_PR.csv		Country_of_Citizen_Forecasted_PR.csv
Country_of_Citizen_PR.csv		Country_of_Citizen_PR.csv
Country_of_Citizen_PR_Efficiency.csv		Country_of_Citizen_PR_Efficiency.csv
Immigration_Forecasting_code.py		Immigration_Forecasting_code.py
Immigrationstatus_PR_People.xlsx		Immigrationstatus_PR_People.xlsx
Metropolitant_PR_People.xlsx		Metropolitant_PR_People.xlsx
PR_GDP_cleaned_dataset.csv		PR_GDP_cleaned_dataset.csv
PR_Prediction_AllProvinces_2018_to_2027.csv		PR_Prediction_AllProvinces_2018_to_2027.csv
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages