發表文章

如何透過googlesheets4連結R與google試算表

圖片
王俞才 你可能跟我一樣,經常透過 Google 表單來做一些簡單的訪問調查。但在調查期間裡,你的主管或指導老師可能會希望你能每天即時回報最新的調查訪問情形。於是你就必須在 R 與 google 兩者間做著以下重複的事情,完成後,再把資料檔或報表存回雲端硬碟裡。 step1. 從 Google 表單中轉出試算表 step2. > dataset <- read.csv="" span=""> "some_surveydata.csv") step3. 在 R 軟體中進行資料清理與分析的工作 step4. > write.csv(dataset, "surveydata.csv" ) step5. 繼續在 Google 試算表中完成後續的工作 這一連串看似簡單卻繁瑣的工作,一直都沒有什麼工具可以幫助你簡化流程。不過現在 googlesheets4 套件可以協助你解決這樣的問題! googlesheets4 提供了一個經由 Sheets API v4 連結 Google 試算表的界面。透過 googlesheets4 你可以直接讀取 Google 試算表中的資料,並且在雲端硬碟裡更新表單 [1] 。你可能會問:「為什麼要叫 googlesheets4 ?我是不是錯過了 googlesheets1 到 3 呢?」其實並沒有喔! googlesheets4 之所以命名為 4 ,只是因為 Sheets API 為第 4 版!我們就直接來看 googlesheets4 是如何進行操作的。 一、                   安裝套件 你可以透過 CRAN 來下載最新釋出的 googlesheets4 。 > install.packages( "googlesheets4" ) > library (googlesheets4) 或這經由 GitHub 下載開發版的 googlesheets4 。 > install.packages( "devtools" ) > devtools::install_githu

助理救星-穿梭於SPSS和R之間

圖片
助理救星-穿梭於SPSS和R之間 許哲維 前言 資料整理是分析前的必經之路,包括資料的讀取、檢核、修改、重新編碼和合併等。過去大多是透過SPSS、SAS、Stata、甚至Excel等商業軟體來完成。近來資料科學蓬勃發展,愈來愈多人受到R等開源軟體豐富的套件庫、社群互動活躍等特色所吸引,轉向使用開源軟體來進行資料分析,然而,在此同時他們卻常面臨到不同資料儲存格式造成的隔閡,不得其門而入。過去筆者擔任研究助理期間,大多時間處理sav或是dta檔,但分析資料或製圖又得仰賴R的套件,陷入常常需要花費時間上網搜尋相關套件來讀取資料,資料讀進來之後卻變成亂碼,再上網尋找解答的無限循環中。總幻想著可以博采眾軟體之長,實際卻都在做資料轉換,這或許正是許多跨越軟體使用者的寫照吧。所幸筆者在不斷爬文的過程中發現R的套件庫,有佛心開發者提供一系列的套件,幫助人們減輕檔案格式所造成的困擾,這也就是本文所要介紹的 strengejacke 系列的套件,希望透過本文的介紹,可以幫助大家減少走冤枉路的時間,將更多精力放在分析上。 本文將一步步帶著大家,從資料讀取開始認識此套件的使用方法,介紹一些資料處理常用到的功能,並示範簡單的資料探索、視覺化呈現,最後 將 以線性迴歸模型的製圖和製表做結,而本文示範的語法也可以點此 連結 參考。本文主要目的希望可以與讀者分享這個實用的資料處理套件,將著重於使用本套件內的功能和一些筆者使用後的經驗分享,若是想要從基礎認識R,則可以參考本部落格之前的 介紹 。 套件版本說明 因為R的套件發展迅速,有時候不同版本的功能會落差,因此,若遇到錯誤訊息時,請先確認一下是否為版本差異所造成。本文所使用的套件版本為如下: xxxxxxxxxx 6 1 ## [1] "R 3.5.3" 2 ## [1] "sjlabelled 1.1.3" 3 ## [1] "sjmisc 2.8.3" 4 ## [1] "sjPlot 2.8.2" 5 ## [1] "rio 0.5.16" 6 ## [1] "foreign 0.8.75" 示範資料說明 本文示範的資料取自SRDA資料庫的「 107年來臺旅客消費及動向調查(公共版) 」, 1 此為交