Pacotes no R

Pacotes no R

Um pacote é como uma coleção de funções, dados e arquivos de ajuda agrupados em uma estrutura padrão bem definida que pode ser baixada e instalada em R. Então, pode-se dizer que os pacotes são códigos uteis e instaláveis que permitem estender os recursos do R para realizar as funções desejadas. Esses pacotes são compartilhados e podem ser baixados de várias fontes, sendo as mais populares o CRAN, Bioconductor e o GitHub. CRAN – é o repositório oficial do R para pacotes montados por usuários. Bioconductor – fornece software de código aberto orientado para bioinformática. GitHub – é um site que hospeda repositórios git para todos os tipos de software e projetos (não apenas R). É onde as versões de desenvolvimento de ponta dos pacotes R são hospedadas

Os pacotes necessários para rodar análises no R depende do objetivo do trabalho a ser realizado, mas alguns pacotes são básicos e essenciais para a maioria das análises, como: Tidyverse, dplyr, readxl, ggplot, etc. Nas próximas aulas, aprofundaremos um pouco mais sobre esses pacotes.

Instalação e carregamento pacotes

A instalação e o carregamento de pacotes pode ser feito pelo menu ou então com um comando no console. O fluxo básico pode ser conferido neste link. A instalação é feita através do menu: tools > install packages, indo em packages > install e digitando o nome do pacote para baixar ou usando a função instal.packages(nome do pacote) no console. Para o carregamento de pacotes, a função utilizada é library(nome do pacote). O carregamento pode ser feito tanto pelo library, anotando entre parênteses o nome do pacote, quanto separando os programas por vírgula dentro do mesmo parêntese. Muitas vezes, durante o carregamento de pacotes, usamos as hashtags (#) seguidas por / warning: false e / message: false para desativar a exibição de avisos (warnings) e mensagens durante a execução do código, já que muitos pacotes exibem mensagens e avisos grandes após o carregamento que poluem o arquivo.

library(tidyverse)
library(metafor)
library(gsheet)
library(remotes)

Funções de pacotes:

As funções de pacotes são variadas e serão apresentadas de forma mais aprofundada na próxima aula (Dataframe). Enquanto isso, veremos rapidamente como invocar uma função de um pacote, mais especificamente a função arrange, do pacote dplyr. Para isso, utilizaremos o conjunto de dados mtcars, um conjunto de dados incorporado no R. “arrange()” é uma função do pacote dplyr que permite ordenar os dados com base em uma ou mais variáveis. Nesse caso, a função “arrange()” está sendo aplicada ao conjunto de dados “mtcars”, e a variável “cyl” está sendo especificada como a variável de ordenação. Isso significa que os dados serão reorganizados de forma ascendente com base na variável “cyl”). Nas linhas seguintes, os comandos utilizados referem-se a busca de uma planilha especifica do google sheet e a instalação de um pacote “r4pde” diretamente do repositório GitHub do uduário Emerson Del Ponte. O sinal de igual é utilizado para atribuição, que pode ser substituido por <-. A função head() retorna as primeiras linhas de um objeto de dados ou de um conjunto de dados, nesse caso, foi utilizado para retornar as primeiras linhas do conjunto mtcars.

mtcars
                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
arrange(mtcars, cyl)
                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
Orange
Grouped Data: circumference ~ age | Tree
   Tree  age circumference
1     1  118            30
2     1  484            58
3     1  664            87
4     1 1004           115
5     1 1231           120
6     1 1372           142
7     1 1582           145
8     2  118            33
9     2  484            69
10    2  664           111
11    2 1004           156
12    2 1231           172
13    2 1372           203
14    2 1582           203
15    3  118            30
16    3  484            51
17    3  664            75
18    3 1004           108
19    3 1231           115
20    3 1372           139
21    3 1582           140
22    4  118            32
23    4  484            62
24    4  664           112
25    4 1004           167
26    4 1231           179
27    4 1372           209
28    4 1582           214
29    5  118            30
30    5  484            49
31    5  664            81
32    5 1004           125
33    5 1231           142
34    5 1372           174
35    5 1582           177
url = gsheet2tbl('docs.google.com/spreadsheets/d/1I9mJsS5QnXF2TNNntTy-HrcdHmIF9wJ8ONYvEJTXSNo') 

b = url
install_github("emdelponte/r4pde")
vctrs  (0.5.2 -> 0.6.3) [CRAN]
cli    (3.6.0 -> 3.6.1) [CRAN]
tibble (3.1.8 -> 3.2.1) [CRAN]
dplyr  (1.1.0 -> 1.1.2) [CRAN]
igraph (1.4.3 -> 1.5.0) [CRAN]

  There is a binary version available but the source version is later:
       binary source needs_compilation
igraph  1.4.3  1.5.0              TRUE

package 'vctrs' successfully unpacked and MD5 sums checked
package 'cli' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\nivia\AppData\Local\Temp\RtmpmaWy57\downloaded_packages
── R CMD build ─────────────────────────────────────────────────────────────────
* checking for file 'C:\Users\nivia\AppData\Local\Temp\RtmpmaWy57\remotes3bfc5dd13bbb\emdelponte-r4pde-c1cc0b7/DESCRIPTION' ... OK
* preparing 'r4pde':
* checking DESCRIPTION meta-information ... OK
* checking for LF line-endings in source and make files and shell scripts
* checking for empty or unneeded directories
* building 'r4pde_0.0.0.9000.tar.gz'
head(mtcars)
                   mpg cyl disp  hp drat    wt  qsec vs am gear carb
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

Pacote r4pde: Em linhas gerais, a variável “unit” é criada e atribuída com os valores de 1 a 12 através da função c(1:12), depois a variável “class” também é criada. Posteriormente, é feita a criação de um data frame “ratings” com essas variáveis e, em seguida, aplica a função “DSI” do pacote r4pde aos dados. O bloco de comandos mais abaixo fornece instruções para visualizar os valores, calcular a média (mean), o desvio padrão (sd) e obter um resumo estatístico da variável “class” do conjunto de dados “ratings” (função summary).

library(r4pde)
unit <- c(1:12)
class <- c(2,3,1,1,3,4,5,0,2,5,2,1)
ratings <- data.frame(unit, class)
DSI(unit = ratings$unit, class = ratings$class, max = 6)
[1] 40.27778
ratings$class
 [1] 2 3 1 1 3 4 5 0 2 5 2 1
mean(ratings$class)
[1] 2.416667
sd(ratings$class)
[1] 1.621354
summary(ratings$class)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.000   1.000   2.000   2.417   3.250   5.000 
summary(class)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.000   1.000   2.000   2.417   3.250   5.000