Merge and aggregate datasets: Difference between revisions

Content added Content deleted

Inline

@@ Line 796: / Line 796: @@
 | Wirth    | 2020-11-05 | 15.4       | 7.7
 | Kurtz    |            |            |            </pre>
+=={{header|J}}==
+One approach here would be to use [[j:Jd/Index|Jd]]
+In other words, we can set things up like this:
+<lang J>NB. setup:
+require'jd pacman'
+load JDP,'tools/csv_load.ijs'
+F=: jpath '~temp/rosettacode/example/CSV'
+jdcreatefolder_jd_ CSVFOLDER=: F
+assert 0<{{)n
+PATIENTID,LASTNAME
+,Hopper
+,Wirth
+,Kemeny
+,Gosling
+,Kurtz
+}} fwrite F,'patients.csv'
+assert 0<{{)n
+PATIENTID,VISIT_DATE,SCORE
+,2020-09-10,6.8
+,2020-09-17,5.5
+,2020-09-24,8.4
+,2020-10-08,
+,,6.6
+,2020-11-12,
+,2020-11-05,7.0
+,2020-11-19,5.3
+}} fwrite F,'visits.csv'
+csvprepare 'patients';F,'patients.csv'
+csvprepare 'visits';F,'visits.csv'
+csvload 'patients';1
+csvload 'visits';1
+jd'ref patients PATIENTID  visits PATIENTID'</lang>
+And, then we can run our query:
+<lang J>require'jd'
+echo jd {{)n
+  reads
+        PATIENT_ID: first p.PATIENTID,
+        LASTNAME:   first p.LASTNAME,
+        LAST_VISIT: max v.VISIT_DATE,
+        SCORE_SUM:  sum v.SCORE,
+        SCORE_AVG:  avg v.SCORE
+    by
+      p.PATIENTID
+    from
+      p:patients,
+      v:p.visits
+}} -.LF</lang>
+Which displays this result:
+<pre>┌───────────┬──────────┬────────┬──────────┬─────────┬─────────┐
+│p.PATIENTID│PATIENT_ID│LASTNAME│LAST_VISIT│SCORE_SUM│SCORE_AVG│
+├───────────┼──────────┼────────┼──────────┼─────────┼─────────┤
+│1001       │1001      │Hopper  │2020-09-17│5.5      │5.5      │
+│4004       │4004      │Wirth   │2020-09-24│8.4      │8.4      │
+│3003       │3003      │Kemeny  │2020-11-12│ __      │ __      │
+│2002       │2002      │Gosling │2020-09-10│6.8      │6.8      │
+│5005       │5005      │Kurtz   │?         │  0      │  0      │
+└───────────┴──────────┴────────┴──────────┴─────────┴─────────┘</pre>
 =={{header|jq}}==