Visualização de dados para correlacionar COVID-19 e privação material no Brasil

 

Prevalência de casos de SRAG por COVID-19 e não especificado em gestantes a cada 100 mulheres residentes por IBP dos setores censitários do município de São Paulo. De: Elaboração do autor no software RStudio.

 

Essa é uma pesquisa de mestrado em andamento no Programa de Pós Graduação em Design da Universidade Federal do Rio Janeiro (PPGD-UFRJ) e no Laboratório de Visualidade e Visualização (LabVis). Ela emprega a visualização de dados no projeto de uma plataforma para relacionar a privação material com as diferenças de gravidade e desfechos de COVID-19 em gestantes e mães de recém nascidos. Também analisa diversos artefatos de visualização interativa do mesmo assunto para estabelecer critérios de boas práticas de projeto e espera servir como estudo contribuindo com descobertas que aprimorem as diretrizes de construção de visualizações de dados.

 

A qual pergunta a pesquisa responde?

Como a visualização de dados pode mostrar a relação da privação material com as diferenças de gravidade e desfechos de COVID-19 em gestantes e mães de recém nascidos por entre a população brasileira?

 

Por que isso é relevante?

Apesar de algumas ferramentas de visualização, publicações e estudos já tratarem da relação entre gravidade e desfechos de COVID-19 e condições de vulnerabilidade, boa parte desses trabalhos se limitam ao recorte de regiões específicas, e poucas delas são regiões brasileiras. Observa-se a deficiência na provisão desse tipo de informação para o entendimento de relações entre variáveis e para a tomada de decisão direcionada em saúde pública por entre regiões do Brasil.

 

A concomitância desses eventos (COVID-19 e condições de vulnerabilidade) também impõe desafios para a visualização de dados. A necessidade de permitir na visualização o entendimento de relações estatísticas torna mais complexa a codificação visual. É preciso empregar parâmetros de representação visual afim de que, em uma ferramenta de visualização, eles possam “substituir cálculos cognitivos por inferências perceptivas simples e melhorar a compreensão, a memória e a tomada de decisões” (Heer, Bostock e Ogievetsky, 2010).

 

Levando isso em consideração, essa pesquisa situa sua contribuição em dois aspectos: o primeiro, técnico, propondo auxiliar a comunidade do design da informação e da visualização de dados que visa produzir visualizações efetivas no entendimento de relações estatísticas entre diferentes grupos de dados por parte do público leitor. O segundo, social, contribuindo como referência na criação de visualizações com dados que acionem decisões em políticas públicas, servindo a ações reparadoras, preventivas e de enfrentamento eficaz não só da COVID-19 e de suas implicações, mas de outras adversidades futuras.

 

Resumo da pesquisa

Essa pesquisa pretende empregar a visualização de dados, a partir da condução de um estudo de design (Sedlmair, Meyer e Munzner, 2012), numa solução para entender a relação da privação material medida pelo IBP (Índice Brasileiro de Privação da Cidacs/Fiocruz Bahia) com as diferenças de gravidade e desfechos de COVID-19 em gestantes e mães de recém nascidos por entre a população brasileira. Para isso, busca especificar parâmetros a partir de outras ferramentas de visualização que exibem relações estatísticas entre COVID-19 e fatores de vulnerabilidade à doença como boas práticas de construção. O objetivo é o projeto e a validação de uma ferramenta de visualização que exiba esses indicadores relacionados e que sirva como objeto de estudo contribuindo com descobertas que aprimorem as diretrizes de construção de visualizações de dados.

 

Quais os métodos utilizados?

Como ponto de partida e também de forma transversal durante todo o processo de pesquisa, a revisão bibliográfica sistemática é aplicada fornecendo insumo de literatura, parâmetros de investigação e referência de redação.

 

Também desde o início e de forma transversal são conduzidas explorações nas bases de dados que interessam à pesquisa e que poderão ser acessadas pela ferramenta de visualização. São elas a base de dados unificada dos sistemas e-SUS Notifica e SIVEP-Gripe, a base de dados do IBP por setor censitário da Cidacs/Fiocruz Bahia, e a base de dados dos setores censitários do IBGE. Essa etapa de investigação dos dados é feita utilizando a linguagem R, escolhida pela velocidade de execução em big data, pela disponibilidade de pacotes que automatizam e facilitam a exploração e pela licença open source.

 

Em seguida, é conduzida uma análise comparativa de artefatos, que são ferramentas de visualização de dados publicados por instituições, imprensa e pesquisadores e filtradas pela interseção dos seguintes critérios: (1) ferramentas interativas disponíveis online e (2) ferramentas que possibilitem a observação de relações entre eventos de COVID-19 e outros fatores. Para operacionalizar a comparação, são estabelecidos os parâmetros: tipos de dado; dimensões; tipos de medida; tipos de escala; família de visualização; função de visualização; estrutura de visualização; tarefas de interatividade e grupos de filtro. Espera-se com essa etapa reconhecer padrões e regularidades no design dessas visualizações, identificando critérios prescritivos de concepção e projeto.

 

Por fim, a metodologia norteadora do projeto da ferramenta é o estudo de design, sugerida para pesquisa em visualização orientada a solução de problemas (Sedlmair, Meyer e Munzner, 2012). O processo se dá com o levantamento de requerimentos e entendimento das tarefas dos usuários-chave na etapa de discovery; com a geração de soluções de codificação visual e de mecanismos de interação na etapa de design – empregando aqui os elementos prescritivos obtidos na análise comparativa; com a prototipação e validação de usabilidade da ferramenta na etapa de implementação; e com o desenvolvimento e validação de uso com os usuários-chave na etapa de deploy.

 

O que a pesquisa já produziu e em que etapa se encontra?

Já foram feitas as primeiras iterações de revisão bibliográfica sistemática e as explorações nas bases dos dados, com a geração e a documentação de resultados, bem como uma das conversas com especialistas que demanda a etapa de discovery do estudo de design. A pesquisa atualmente encontra-se dedicada à etapa da análise comparativa.

 

Quais os próximos passos?

Espera-se que a análise comparativa provenha elementos prescritivos para o projeto de ferramenta de visualização, que deverá seguir as etapas do estudo de design. Todas as etapas do estudo, com o aprendizado a partir do projeto da ferramenta, serão documentados na dissertação.

 

 

 

 

Bibliografia

Ordem alfabética por autor

 

AL-ALI, N. Covid-19 and feminism in the Global South: Challenges, initiatives and dilemmas. European Journal of Women’s Studies, v. 27, n. 4, p. 333–347, 1 nov. 2020.

BÖRNER, K.; BUECKLE, A.; GINDA, M. Data visualization literacy: Definitions, conceptual frameworks, exercises, and assessments. Proceedings of the National Academy of Sciences, v. 116, n. 6, p. 1857–1864, 5 fev. 2019.

BOWE, E.; SIMMONS, E.; MATTERN, S. Learning from lines: Critical COVID data visualizations and the quarantine quotidian. Big Data & Society, v. 7, n. 2, p. 2053951720939236, 1 jul. 2020.

BRAS, P. L. et al. Visualising COVID-19 Research. 13 maio 2020.

BURNAY, C.; DARGAM, F.; ZARATÉ, P. Data visualization for decision-making: an important issue. Operational Research, Operational Research – An International Journal. v. 19, n. 4, p. 853–855, 2019.

CAIRO, A. How Charts Lie: Getting Smarter about Visual Information. [s.l.] W. W. Norton & Company, 2020.

CARPENDALE, S. Evaluating Information Visualizations. In: KERREN, A. et al. (Eds.). . Information Visualization. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer Berlin Heidelberg, 2008. v. 4950p. 19–45.

COMBA, J. L. D. Data Visualization for the Understanding of COVID-19. Computing in Science Engineering, v. 22, n. 6, p. 81–86, nov. 2020.

D’IGNAZIO, C.; F. KLEIN, L. Seven intersectional feminist principles for equitable and actionable COVID-19 data. Big Data & Society, v. 7, n. 2, p. 2053951720942544, 1 jul. 2020.

DOAN, S. Misrepresenting COVID-19: Lying With Charts During the Second Golden Age of Data Design. Journal of Business and Technical Communication, v. 35, n. 1, p. 73–79, 1 jan. 2021.

DOWDING, D.; MERRILL, J. A. The Development of Heuristics for Evaluation of Dashboard Visualizations. Applied Clinical Informatics, v. 9, n. 3, p. 511–518, jul. 2018.

EVERETT, J. A. et al. The effectiveness of moral messages on public health behavioral intentions during the COVID-19 pandemicPsyArXiv, , 20 mar. 2020. Disponível em: <https://psyarxiv.com/9yqs8/>. Acesso em: 19 nov. 2021

FORSELL, C.; COOPER, M. An Introduction and Guide to Evaluation of Visualization Techniques Through User Studies. In: HUANG, W. (Ed.). . Handbook of Human Centric Visualization. New York, NY: Springer New York, 2014. p. 285–313.

FRIENDLY, M.; WAINER, H. A history of data visualization and graphic communication. Cambridge, Massachusetts: Harvard University Press, 2021.

GIANNELLA, J. R.; VELHO, L. Data visualization in the time of coronavirus. Strategic Design Research Journal, v. 14, n. 1, p. 275–288, 9 abr. 2021.

GUNAWARDANE, P. et al. Analyzing statistical relationships between global indicators through visualization. 2009 International Conference on Information and Communication Technologies and Development (ICTD). Anais… In: 2009 INTERNATIONAL CONFERENCE ON INFORMATION AND COMMUNICATION TECHNOLOGIES AND DEVELOPMENT (ICTD). abr. 2009.

HESSE, B. W.; MOSER, R. P.; RILEY, W. T. From Big Data to Knowledge in the Social Sciences. The ANNALS of the American Academy of Political and Social Science, v. 659, n. 1, p. 16–32, 1 maio 2015.

HILDON, Z.; ALLWOOD, D.; BLACK, N. Impact of format and content of visual display of data on comprehension, choice and preference: a systematic review. International Journal for Quality in Health Care, v. 24, n. 1, p. 55–64, 2012.

ISENBERG, P. et al. Grounded evaluation of information visualizations. Proceedings of the 2008 conference on BEyond time and errors novel evaLuation methods for Information Visualization – BELIV ’08. Anais… In: THE 2008 CONFERENCE. Florence, Italy: ACM Press, 2008. Disponível em: <http://portal.acm.org/citation.cfm?doid=1377966.1377974>. Acesso em: 15 nov. 2021

LEUNG, C. K. et al. Big Data Visualization and Visual Analytics of COVID-19 Data. 2020 24th International Conference Information Visualisation (IV). Anais… In: 2020 24TH INTERNATIONAL CONFERENCE INFORMATION VISUALISATION (IV). set. 2020.

LIU, S. et al. COVID-19 Health Equity Dashboard – Addressing Vulnerable Populations. [s.l.] Open Science Framework, 25 ago. 2020. Disponível em: <https://osf.io/2frha>. Acesso em: 21 nov. 2021.

MERCATELLI, D.; HOLDING, A. N.; GIORGI, F. M. Web tools to fight pandemics: the COVID-19 experience. Briefings in Bioinformatics, v. 22, n. 2, p. 690–700, 22 mar. 2021.

MEYER, M.; DYKES, J. Criteria for Rigor in Visualization Design Study. IEEE Transactions on Visualization and Computer Graphics, v. 26, n. 1, p. 87–97, jan. 2020.

ROMANO, A. et al. The scale of COVID-19 graphs affects understanding, attitudes, and policy preferences. Health Economics, v. 29, n. 11, p. 1482–1494, 1 nov. 2020.

SCHOLZ, R. W.; LU, Y. Uncertainty in Geographic Data on Bivariate Maps: An Examination of Visualization Preference and Decision Making. ISPRS International Journal of Geo-Information, v. 3, n. 4, p. 1180–1197, dez. 2014.

SEDLMAIR, M.; MEYER, M.; MUNZNER, T. Design Study Methodology: Reflections from the Trenches and the Stacks. IEEE Transactions on Visualization and Computer Graphics, v. 18, n. 12, p. 2431–2440, dez. 2012.

SEGEL, E.; HEER, J. Narrative Visualization: Telling Stories with Data. IEEE Transactions on Visualization and Computer Graphics, v. 16, n. 6, p. 1139–1148, nov. 2010.

SHNEIDERMAN, B. The eyes have it: a task by data type taxonomy for information visualizations. Proceedings 1996 IEEE Symposium on Visual Languages. Anais… In: PROCEEDINGS 1996 IEEE SYMPOSIUM ON VISUAL LANGUAGES. set. 1996.

SRABANTI, S. COVID-19 EnsembleVis: Visual Analysis of County-Level Ensemble Forecast Models. p. 5, [s.d.].

TORY, M. User Studies in Visualization: A Reflection on Methods. In: HUANG, W. (Ed.). . Handbook of Human Centric Visualization. New York, NY: Springer New York, 2014. p. 411–426.

TUFTE, E. R. Visual explanations: images and quantities, evidence and narrative. Cheshire, Conn: Graphics Press, 1997.

VERHULSDONCK, G.; SHAH, V. Lean Data Visualization: Considering Actionable Metrics for Technical Communication. Journal of Business and Technical Communication, v. 35, n. 1, p. 57–64, 1 jan. 2021.

YI, J. S. et al. Toward a Deeper Understanding of the Role of Interaction in Information Visualization. IEEE Transactions on Visualization and Computer Graphics, v. 13, n. 6, p. 1224–1231, nov. 2007.

ZHANG, H. et al. Uncertainty visualization for variable associations analysis. The Visual Computer, v. 34, n. 4, p. 531–549, 1 abr. 2018.

ZHANG, Y. et al. Mapping the Landscape of COVID-19 Crisis Visualizations. 12 jan. 2021.

ZUK, T. et al. Heuristics for information visualization evaluation. Proceedings of the 2006 AVI workshop on BEyond time and errors: novel evaluation methods for information visualization. Anais…: BELIV ’06.New York, NY, USA: Association for Computing Machinery, 23 maio 2006. Disponível em: <https://doi.org/10.1145/1168149.1168162>. Acesso em: 15 nov. 2021