Welkom bij marco@work, waar ik mijn promotieonderzoek documenteer in het kader van het Determinants of Dialectal Variation project.
Welcome to marco@work, where I document my Ph.D research in the context of the Determinants of Dialectal Variation project.

 Onderdelen
· Startpagina
· Afbeeldingen
· Archief
· Downloads
· Lidmaatschap
· Links
· Onderwerpen
· Statistieken

 Speerpunten
· Meertens pagina
· Video
· Powerpoint
· Paper
· Status
· Literatuurlijst
· Project portaal
· Recentelijk
· Taalhulpjes
· /

 Babylon

 Prijsuitreiking


 marco@work

© 2003-2007
Marco Rene Spruit

marco@work: Software

Zoek op dit onderwerp:   
[ Ga naar startpagina | Kies een nieuw onderwerp ]

Software R

De afgelopen week heb ik geworsteld met R, de gratis en open source software voor statistisch onderzoek, om een begin te maken met een overgang van het commerciele en drakonische SPSS... Maar dat valt natuurlijk niet mee! R is een taal -en scriptomgeving, het heeft geen menu-gestuurde interface.

Mijn eerste R-doel is om de uitvoer van mijn software voor syntactische metingen als R data frames te kunnen benaderen. Hiervoor gebruik ik mede de iL04 interface van Peter Kleiweg.

Dit is nog werk in uitvoering, maar mijn toolchain genereert al een enigzins werkend R-script voor ieder metingsresultaat waarmee ik in R kan verder experimenteren, zoals je hier kunt zien...

(Meer lezen... | 3421 bytes meer |



Software Geografische afstanden en de ideale MDS kaart

De ideale MDS kaart Mijn sync software programma berekent nu ook de geografische afstand tussen dialect locatieparen. Dit betekent dat ik de beschikbare Rijksdriehoeksmeting (RD) coordinaten, waarin de dialectlocaties opgetekend zijn, eerst converteer naar World Geodetic Survey (WGS84) coordinaten mbv de rd2wgs code, waarna ik vervolgens mbv de Geodesy Foundation Classes (GFC) de geografische afstand tussen twee WGS84 coordinaten bepaal.

sync genereert nu behalve het .dif matrix bestand met de syntactische afstanden tevens .gdt (geographic distance table) en .tab (tab-separated value) matrix bestanden met de geografische afstanden. Het verwerken van deze geografische afstandsmatrix via de MDS procedure resulteert logischerwijs in het hiernaast getoonde ideale geografische kleurencontinuum. Met andere woorden, deze MDS kaart zou het resultaat zijn indien er sprake zou zijn van 100% correlatie tussen syntactische en geografische afstand.

De logische volgende stap is het uitvoeren van een regressie-analyse op deze twee matrices om de correlatie tussen de syntactische (afhankelijke variabele) en geografische afstand (onafhankelijke variabele) te bepalen.




Software Linux

Eindelijk heb ik de tijd genomen om mijn promotieonderzoek-software geschikt te maken te maken voor het Linux besturingssysteem, en andere Unix varianten. Dit betekende vooral een hoop technisch geploeter met Makefiles om de broncode te kunnen compileren. Deze maakt immers gebruik van het wxWidgets C++ raamwerk dat op zijn beurt onder meer de expat parser opgenomen heeft...

Niet alleen de C++ code maar ook het basc script zijn nu inzetbaar op Linux. Natuurlijk zit er, net als bij het geschikt maken van mijn programma's voor MacOSX, wel een adder onder het gras, ook wel Dependency Hell genaamd. Direct gebruik van vooraf gecompileerde versies van de programma's is daarom nog niet mogelijk, maar het overbodig maken van het archaische make compilatiecommando hoop ik binnenkort te bereiken...

Ik ben overigens van plan m'n software vóór mijn eerste publieke presentatie beschikbaar te stellen...




Software basc 0.3

Dankzij de BAtch Script Console (basc) die ik recentelijk ontwikkeld heb, hoef ik nu nog maar 1 batch script te onderhouden en uit te breiden. Het is een oplossing voor het probleem dat ik voor verschillende besturingssystemen verschillende shell scripts moest schrijven en onderhouden, voor Windows een .BAT bestand en op de Mac een .SH script. Een goede tijdsinvestering: nu kan ik dankzij basc cross-platform en onder volledige uitvoeringscontrole commando's uitproberen.

Deze eerste versie bevat overigens nog geen mogelijkheden die anders niet eenvoudig mogelijk zouden zijn, zoals bijvoorbeeld het analyseren van schermuitvoer en het verwerken hiervan in latere commando's, maar dat komt ongetwijfeld binnenkort...




Software The GNU Compiler Collection on Mac OS X

Dit achtergrondartikel beschrijft de GNU Compiler Collection (GCC) van de Free Software Foundation en het gebruik hiervan op de Mac. Dit is interessant voor mij aangezien deze tools aan de basis liggen van Apple's Xcode ontwikkelomgeving die ik gebruik voor de Mac versies van mijn software.




Software dimp 0.3

Het Data IMport Program (dimp) dat ik afgelopen week geschreven heb, leest een verzameling kloekelijstjes in die in CSV formaat opgesteld zijn, en schrijft deze vervolgens weg in XML formaat voor verwerking door mijn SYNtactische measurement Console (sync).

Ik kan nu beschikken over data met betrekking tot de thema's voegwoordvervoeging, pronomina & expletieven, subjectdubbeling & ja/nee vervoeging, reflexieven en vooropplaatsing. Overigens heb ik het XML formaat van de SAND data enigzins aangepast; de representatie is nu compacter en daardoor tevens beter leesbaar.

Het automatiseren van de voorbewerking van de gegevens die aan de basis liggen van mijn onderzoek komt natuurlijk ook van pas wanneer de gegevens voor deel 2 van de SAND beschikbaar komen.




Software finc 0.25

Met het FINe-tune postscript map Console (finc) hulpprogramma waar ik de afgelopen week aan gesleuteld heb, is het mogelijk om door middel van het opgeven van een folder en bestandsnaampatroon een verzameling PostScript bestanden te laten naverwerken op basis van een configuratiebestand.

Aanleiding voor het ontwikkelen van dit hulpprogrammaatje was dat ik graag op automatische wijze de handmatige fine-tuning van de locatie coordinaten op de geografische distributiekaarten die ik had uitgevoerd voor de SAND-meetpuntenkaart wilde incorporeren in alle kaarten die door het sync programma nog gegenereerd zullen worden.

Bovendien heb ik een al lange tijd openstaand probleem opgelost wat ik had met sync op MacOSX, waardoor de software nu eindelijk probleemloos werkt onder zowel Windows als Mac OS X.

(Meer lezen... | 7982 bytes meer |



Software Xcode Workflow

Xcode Workflow geeft een goed overzicht van het werken in Apple's Xcode Integrated Development Environment (IDE). Overigens lijkt de nieuwe 1.5 versie zowaar werkbaar te zijn; vergeleken met de ontelbare willekeurige crashes van de vorige 1.2 versie een verademing...




Software sync 0.23

Tijdens het voorbereiden van mijn eerste presentatie voor m'n Variatielinguistiekgenoten bleek het Perl script mdsplot van Peter Kleiweg niet identieke vectors te kunnen verwerken, oftewel locaties met een onderlinge afstand van 0. Daarom heb ik aan mijn syntactic measurement console programma (sync) een optie toegevoegd waarmee altijd een minimale afstand wordt toegekend... De belangrijkste verbetering aan sync is echter de mogelijkheid om een willekeurig aantal XML-databestanden op te geven voor verwerking.




Software sync 0.22

In navolging op m'n eerste kaart, waarvan de gegevens helaas niet al te betrouwbaar bleken, heb ik mijn syntactic measurement console programma (sync) dusdanig verbeterd dat ik er een versienummer aan heb toegekend: 0.22. Zo worden nu bijvoorbeeld de meldingen naar aanleiding van problematische data gedetailleerd naar de console geschreven. Deze waarschuwingen en foutmeldingen bleken dermate goed dat ik tevens enkele subtiele problemen met de programmacode op het spoor kwam...

Vanaf sync 0.22 is het tevens mogelijk om het programma op Mac OS X in combinatie met de Xcode ontwikkelomgeving te gebruiken, waar ik logischerwijs heel blij mee ben aangezien ik zelf voornamelijk met Mac OS X werk, maar met enige kanttekeningen... Aangezien ik er nog niet achter ben hoe ik afhankelijkheden met externe bibliotheken en de verwachte locatie ervan kan wegpoetsen, werkt het programma vooralsnog enkel op Mac OS X-systemen waarop tevens wxWidgets 2.5.2 geinstalleerd is... Wordt dus wederom vervolgd, maar vanaf nu met een lagere prioriteit.