Velocidad de Escape
Blogalia

"En el arte marcial como en la vida diaria. En la vida diaria como en un arte marcial."

Aikido

Sígueme en Twitter

<Julio 2016
Lu Ma Mi Ju Vi Sa Do
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
             


Todas las Historias

VELOCIDAD DE ESCAPE

2016-06-15

COSAS QUE NUNCA TE DIJE, EN R. (1)

Cuando llevas un tiempo pegándote con esto del Data Science, que es, a decir de los entendidos, lo que yo hago aunque lleve haciéndolo desde casi el siglo pasado, entonces bajo otros nombres, terminas llegando a R.

Y es lógico, pues se trata del lenguaje más útil que puedes aprender si lidias con datos. R está muy arriba, sólo en la cúspide, con el SQL a muy corta distancia, y un poco más atrás Python.

Dedicarse a esto y no conocer SQL y R es como pretender correr una maratón con grilletes en ambos pies. Mejor dedícate a otra cosa. Llegarás tarde, llegarás mal, y llegarás magullado.

Ya hace casi dos años que topé con este maravilloso, potente, fascinante (se me acaban los adjetivos) lenguaje, y no puedo hacer más que recomendarlo.
Al principio con timidez, y en la última época intensivamente, lo uso a diario, y a diario también, me sorprende con cosas nuevas.
A diario. ¿de cuántos lenguajes se puede decir lo mismo?

Como todo nuevo lenguaje, al principio te toca "pelearte" con ciertos comportamientos "extraños", que no vienen sino a ser peculiaridades del propio lenguaje,
y que pronto comienzas a reconocer, como cuando se reconoce a un viejo amigo. Sin embargo, estas pequeñas "peleas" no aparecen en los ejemplos ni en los tutoriales de la web.
Te quitan no pocas horas, pero son cosas tan elementales o al margen del objetivo central de un proyecto que se obvian o no se suelen mencionar y siempre eché de menos que alguien me hubiese echado una mano en esos momentos.

Pues aquí va mi aportación. Esta serie se denomina: "Cosas que nunca te dije. En R"

Lo habitual cuando manipulas tus datos y estás en una fase inicial, es que de todo el set de datos, en un momento dado deseas quedarte con un conjunto reducido.
Esto en R se denomina "subsetting", y es muy habitual.

Imaginemos un pequeño set de datos:

Generamos dos secuencias. Una de letras y otra de números y con ellas componemos el dataframe (objeto tabular básico de R)

df <- data.frame(letters=letters[1:5],numbers=seq(1:5))

 
df
 
letters numbers
1 a 1
2 b 2
3 c 3
4 d 4
5 e 5



Veamos los diferentes Levels de los Factores. Levels viene a ser el equivalente de UNIQUE ó DISTINCT y los Factores son aquellas columnas que almacenan valores categóricos, que pueden ser tanto numeros como cadenas de texto.


levels(df$letters)

[1] "a" "b" "c" "d" "e"


Hacemos un subsetting de las filas cuyo número sea mayor de 3

subdf <- subset(df, numbers <=3)

 
subdf
 
letters numbers
1 a 1
2 b 2
3 c 3

Y ahora viene lo bueno: Volvemos a mirar los Levels
levels(subdf$letters)

[1] "a" "b" "c" "d" "e"

¿¿CÓMO ES POSIBLE QUE SEAN LOS MISMOS ?? si hemos eliminado filas!!
Huelga decir que intentas hacer el subsetting de otras maneras, pero siempre terminas llegando a la misma conclusión: hago algo mal y no sé qué es.

Lo único que ocurre es que R conserva los Levels originales de un factor aunque hagamos subsetting.
Se soluciona habitualmente factorizando de nuevo o con droplevels

# factorizando

subdf$letters <- factor(subdf$letters)
 
# droplevels
subdf$letters <- droplevels(subdf$letters)
 
 
# et voilá
 
levels(subdf$letters)
[1] "a" "b" "c"

Programación | jomaweb | 0 Comentarios | Enlace


2016-01-17

BREVE ESTADO DE SITUACIÓN 2

Decíamos ayer:

Los directivos de la empresa adolecen de lo que suelen adolecer todos, es decir, el más minimo conocimiento de lo que es un dato, no hablemos ya de su importancia o de los requisitos y procedimientos para tratar los mismos. Esto, que es lo normal, en una start-up es un hecho de extrema gravedad y hace que aun teniendo todos los vientos a favor, no le vea mucho futuro, si no al proyecto por sí mismo, por descontado a MI proyecto profesional en él.
Básicamente porque hace tiempo ya que decidí que si tenía que convencer a mi jefe de las bondades de limpiar y normalizar la entrada de datos, estaba perdiendo mis preciosos tiempo y energía en hacer lo contrario de lo que de verdad tengo que hacer.



Pues han tardado poco los "lumbreras". Ni corto ni perezoso, el estamento directivo da muestras de su inanidad de nuevo.

Pongansé ustedes en situación: reunión de proyectos para planificar el año 2016, manifiesto que el sistema que se utiliza para almacenar la información no es válido para realizar analítica avanzada. Lanzas una petición, te vas de vacaciones y a lo mejor a la vuelta tienes resultados.
Respuesta:

- "Eso es porque tu quieres almacenar demasiadas cosas"

Imaginen mi cara.

Si. Esa cara.

O sea, que se les llena la boca con Big Data, Data mining, machine learning, y demás palabras que normalmente aquí el que las pronuncia no tiene ni puñetera idea de lo que son pero que a poquito listo que seas deja clara la impresión de que son "muchos datos" y cuando se requiere el esfuerzo de comprender que con una hoja de Excel no vamos a poder hacer un trabajo analítico digno de ese nombre, y la conclusión de el estamento directivo es que al analista de datos le ha dado algo así como un síndrome de Diógenes digital y claro, es su culpa no poder analizar lo que tiene que analizar.

No me tocará el Euromillón para comprar la empresa y echarlos a todos a la puta calle por inútiles, no.

Estupidiario y otras cosas | jomaweb | 0 Comentarios | Enlace


2015-11-28

BREVE ESTADO DE SITUACIÓN

Como al final las cosas van donde tienen que ir, estoy haciendo un Master en Data Science. Tantos años dedicado al analisis de datos desde muy diversas posiciones (como programador, como dba, como diseñador de informes...) al final han conducido a la situación actual.

Eso, de por si no es ni malo ni bueno, sino simplemente donde la vida te lleva. Sin embargo, llevo un mes de clases y no puedo evitar aburrirme como un autentico poseso.
No ayuda que yo ya lleve tiempo trabajando en el área, desde luego, pero tengamos en cuenta (al menos eso me consuela) que en el primer mes no vamos a entrar a saco con programación avanzada de DataFrames con Pandas y R (cosa que por otra parte estoy deseando).

Entre medias, un poco de álgebra lineal me recuerda porqué las matematicas no son lo mio. Me trajo gratos recuerdos de mis sufridos cálculos de matrices con lápiz y papel en la facultad, y aunque no hace tantos años de eso parece el siglo pasado (ES, el siglo pasado). Recuerdo que entonces el SPSS estaba en sus primeras versiones y habia que meter los datos a mano uno a uno.
Olvidado (y nunca usado) todo aquello el reecuentro con las matrices ortogonales ha supuesto una mezcla de nostalgia con sudores fríos. Por otra parte, el docente me ha recordado el motivo por el cual una de las causas más que probables, sino principales, si coadyuvantes, de la prolongada crisis que vivimos, es el desembarco de los físicos y matemáticos en los laboratorios de estudio de las entidades financieras.
Cuando llevas media hora entre sumatorios, equis, jotas, y demás nomenclatura, olvidas que tu algoritmo al final afecta a la gente real con vidas reales, y tu maravilloso algoritmo que predice que los CDO son una buena inversión provocan el mayor crash económico que ha vivido el capitalismo desde sus orígenes. Creo que incluso hay un libro con este tema titulado "Cuando los físicos desembarcaron en la economía" o algo similar.

El trabajo, pues muy bien o muy mal, depende de como se mire. Acabado mi periplo por una de las empresas tecnológicas más exitosas del mundo, me pasé junto con algunos compañeros a una Start-up prometedora. El sueldo es decente, la idea buena, el producto bueno, la dirección penosa. Lo normal.

Los directivos de la empresa adolecen de lo que suelen adolecer todos, es decir, el más minimo conocimiento de lo que es un dato, no hablemos ya de su importancia o de los requisitos y procedimientos para tratar los mismos. Esto, que es lo normal, en una start-up es un hecho de extrema gravedad y hace que aun teniendo todos los vientos a favor, no le vea mucho futuro, si no al proyecto por sí mismo, por descontado a MI proyecto profesional en él.
Básicamente porque hace tiempo ya que decidí que si tenía que convencer a mi jefe de las bondades de limpiar y normalizar la entrada de datos, estaba perdiendo mis preciosos tiempo y energía en hacer lo contrario de lo que de verdad tengo que hacer.

Stay tuned.

Estupidiario y otras cosas | jomaweb | 4 Comentarios | Enlace


2015-10-25

CIENCIA FICCIÓN: NUEVA GUIA DE LECTURA, de Miquel Barceló


Se nota demasiado que al autor le puso una pistola en el pecho su agente editorial para sacar un libro que llevaba anunciado muchos años. Decepcionante, incompleta, tendenciosa, todos los calificativos son pocos para describir lo que nunca se hubiera debido publicar en el estado en que se ha publicado.
No está ninguno de los grandes autores de los últimos años. Es un refrito de otro texto anterior (la anterior guía) quitando encima trozos como si fuese un vulgar charcutero..

La única parte que merece la pena es la que esta obviamente copiada de la primera edición de la guía.
Es una auténtica basura que no merece que hayan muerto árboles para dar a luz semejante engendro.

CF | jomaweb | 2 Comentarios | Enlace


2015-08-31

50 GRANDES MITOS DE LA PSICOLOGÍA POPULAR



Este libro deberia de ser de obligada lectura, no ya para los estudiantes de los cursos introductorios de la carrera de Psicología, sino para los estudiantes de medicina, ingeniería, magisterio, o cualesquiera otras personas que prentendan tener un conocimiento cabal de la realidad en lo que a la investigación sobre el comportamiento humano se refiere.

Si por mi fuera, este libro seria de obligada lectura incluso en el bachillerato.

Idioteces como que solo usamos el 10% de nuestra capacidad cerebral, o que los testigos en un juicio son fiables, quedan desmontadas, entre otras (hasta 50) con datos e investigación.

Cultivar el espiritu critico acerca de esta amada ciencia, no está de más, porque sobre ella se vierten todos los dias muchos infundios y supersticiones estúpidas.

Estupidiario y otras cosas | jomaweb | 0 Comentarios | Enlace

LA VERDAD SOBRE EL CASO HERRY QUEBERT, de Joel Dicker



Lo bueno:

Da una envidia terrible que un chaval de 30 años sea capaz de escribir una novela como esta, ser multipremiado y forrarse. A modo de caja china, o muñecas rusas, el relato se trata de una novela dentro de otra. Una meta novela, si se quiere, que te atrapa desde el principio y no puedes dejar hasta que terminas.

Lo malo:

Ha ganado muchos premios, ha sido traducida a multiples idiomas, pero me queda la sensación de que no es una buena novela en el sentido "literario" del término. Diálogos que parecen dictados por niños pequeños y una trama que se ha ce tan abtrusa al final que no es nada raro que te pierdas.
Al final solo deseas que se termine y si te descuidas no terminas de enterarte de la historia real.

Estupidiario y otras cosas | jomaweb | 1 Comentarios | Enlace


2015-08-19

EL CURA Y LOS MANDARINES, de Gregorio Morán



Vitriolo condensado, la pluma de Morán no deja títere con cabeza. Contiene esta obra elogios, si, algunos, pero abunda en descrédito, o desenmascaramiento, que viene a ser lo mismo, de las varias generaciones que han ocupado el sillón oficial de la intelectualidad en España.

Usando el personaje de Jesús Aguirre, Duque de Alba, homosexual reconocido con ínfulas de escritor, para vertebrar la historia cultural del Franquismo y la Transición Españoles, hasta llegar a los fastos del 92, desgrana Morán toda una retahila de nombres que a buen seguro sorprenderá a más de uno encontrar en las tesituras narradas.

Mala leche se te pone al leer cómo los mismos que jaleaban al Caudillo son los que jalean al PSOE, con parada y fonda en la _UCD de Suárez, en una inveterada tradición de "pesebrismo" hispano.

Según palabras del propio Morán: "nos hicieron creer que éramos ricos, y nos lo creímos"

Estupidiario y otras cosas | jomaweb | 1 Comentarios | Enlace


2015-08-11

JAGANNATH, de Karin Tidbeck



Tenía muchas expectativas puestas en esta obra de Tidbeck. Relatos cortos de aire fantastico con un toque Weird. Habia leido tantas reseñas laudatorias que esperaba algo impactante.
Sinceramente no me ha gustado. La mayor parte de los relatos me han parecido a medio hacer. Como un bizcocho a medio hornear, que cuando te lo metes en la boca no termina de ser desagradable pero tampoco termina de satisfacer del todo, dejando esa sensación de promesa, de bizcocho que podría ser y no es.
Pues algo así.
Quizás sea que no me gusta el Weird, pudiera ser, pero todos los relatos me han parecido obras a medio hacer, como si la autora se hubiese cansado cerca de la culminación. Otros dirán que es una forma de dejar la pregunta en el aire, lo extraño tintineando en nuestra mente como un cascabel apenas percibido.
Algo positivo tengo que decir: son relatos cortos y el libro se lee en un suspiro.

| jomaweb | 1 Comentarios | Enlace


2015-07-22

¿PORQUÉ MANDA OCCIDENTE?...POR AHORA, de Ian Morris



Heredero de las mejores obras de Jared Diamond, este libro de Ian Morris merece la pena sobre todo si te gustaron las monumentales disertaciones de Diamond sobre la evolución de las sociedades en los diferentes continentes.
Diamond tiene otros libritos más breves aunque no por ello menos interesantes, sin embargo su "armas gérmenes y acero" es para mí una obra canónica dentro de este género.
Morris es un destacado alumno de esta corriente historiográfica en la que se mezclan múltiples disciplinas para explicar un hecho. Desde la sociología, la antropología pasando por la economía, la paleo climatología y todo lo que aporte hechos y pruebas para llegar a una conclusión válida según términos científicos.
En este caso sobre la cuestión de porque occidente o al menos su cultura domina el mundo, Y tras presentar las diferentes explicaciones teóricas pasa a armar un complejo sistema de medición a través de múltiples parámetros que termina concluyendo, como su maestro, que las razones geográficas son el principal factor de éxito de una civilización.
Morris se centra sin embargo en las diferencias entre oriente y occidente siendo destacable sobre todo su capítulo final en el cual trata de predecir el futuro, y teniendo en cuenta que ahora estamos en periodo en el cual el poder bascula hacia el oriente.

Un libro extenso pero intelectualmente rico y muy interesante.

Estupidiario y otras cosas | jomaweb | 0 Comentarios | Enlace


2015-06-07

OPEN, de Andre Agassi y J.R. Moehringer



"Odio el tenis", y que esta afirmación salga de la boca (de la pluma) de uno de los tenistas más grandes de la historia, impacta desde el mismo comienzo. Claramente te identificas con él. Todos tenemos un trabajo que odiamos en mayor o menor medida, pero que continuamos ejerciendo por diversas razones. En muchos momentos de mi vida he tenido esa sensación de estar atrapado, y no se lo deseo a nadie.

Sin embargo a lo largo del libro siempre me daba la sensación de pensar que a fin de cuentas Agassi es una persona más, con los mismos problemas que los demás, llegando a pensar en ocasiones: "pobre niño rico". Sin embargo, el hecho de que uno de los más grandes deportistas de todos los tiempos tenga las mismas dudas, vacilaciones, caidas, e inseguridades que cualquiera de nosotros, pinta un retrato extremadamente humano de alguien que por su imagen pública bien pudiera equipararse a un dios.

El libro se lee del tirón, y se nota el buen hacer de Moehringer, premio Pulitzer. De hecho, hacía mucho tiempo que un libro no me emocionaba tanto.


"Yo descubrí tarde la magia de los libros. De los muchos errores que quiero que mis hijos eviten, ése ocupa uno de los primeros puestos en la lista.
Andre Agassi

Estupidiario y otras cosas | jomaweb | 0 Comentarios | Enlace


2015-04-19

ALAN TURING. EL HOMBRE QUE SABÍA DEMASIADO, de David Leavitt



Confieso que inicié con ciertas reservas esta breve biografía de Turing. Habitualmente tienden a ser escritas de una manera que se centran en los aspectos más morbosos de su propia personalidad, dejando un sabor agridulce.

Sin embargo, en esta obra, Leavitt hace una muy buena labor, explicando por una parte los grandisimos y revolucionarios aportes a la ciencia que realizó el matemático inglés, de manera muy sencilla y comprensible además, y por otra, un análisis mesurado de lo que Turing como persona era, y de cómo sus caracteristicas personales son parte de su obra y se encuentran diseminadas por doquier para aquel que quiera verlas.
Su homosexualidad, su incapacidad para las relaciones sociales, su tendencia a tomarse los enunciados de manera literal (¿alguien dijo asperger?) son parte integrante de su obra y no podria lo uno existir sin lo otro.

Leavitt muestra que la soledad de Turing, su necesidad de contacto humano, por anecdótico que sea el hecho de que fuese homosexual, le conduciría a la muerte además de a los grandes descubrimientos que en teoría de la computacción hoy nos permiten tener entre otras cosas la máquina que a mí me permite escribir esto, la que lo almacena y distribuye, y la que les permite a ustedes leerlo.

Turing, entre otros, pero principalmente Turing, abrieron un campo de la ciencia en el cual me puedo ganar hoy la vida. Un campo en el que en ocasiones consigo disfrutar con lo que hago, y que me permite aprender todos los dias algo nuevo, hecho que (si me permiten ustedes una acotación personal) hace mi vida más agradable. No concibo otra vida mas que aquella en la que cada dia uno aprende algo nuevo. Todo lo demás es ruido.

Leavitt lo menciona al hablar del propio Turing: "comprender el mundo le importaba más que transformarlo". Me considero en parte identificado con esta descripción. Turing es de aquella rara avis que siendo una persona sin interés por transformar el mundo, sino solamente comprenderlo, logró lo primero por medio de lo segundo.

Estupidiario y otras cosas | jomaweb | 0 Comentarios | Enlace


2015-04-05

POSTGUERRA, de Tony Judt



"A nosotros los alemanes se nos ordenó ser patriotas y nos hicimos patriotas, porque hacemos todo lo que nos mandan nuestros gobernantes. No obstante, no debemos pensar que este patriotismo es igual a la emoción del mismo nombre existente en Francia. El patriotismo de un Francés significa que su corazón se anima y que ese ánimo se estira y expande hasta que su amor ya no solo alcanza a su pariente más próximo, sino a toda Francia, a todo el mundo civilizado. El patriotismo de un Alemán significa que su corazón se contrae y mengua como el cuero con el frío, y entonces el Alemán odia todo lo extranjero, ya no quiere ser ciudadano del mundo, ni europeo, sino sólo un Alemán provinciano".

Heinrich Heine


No puedo hacer una recensión justa de este libro. Su amplitud (1216 páginas) y su erudición son abrumadoras.
Grandiosa, extensa, detallada, multidisciplinar, son algunos de los adjetivos que se me ocurren.

Siempre he sido un asiduo lector de temas relacionados con las dos guerras mundiales, preferentemente la segunda, y entiendo que existía una laguna en mis lecturas en torno a lo sucedido desde la última gran guerra en Europa. El libro de Judt cubre esa ausencia con creces. Al acabar el libro sientes mucho más la inmensa pérdida que supone la desaparición del autor aunque deja obras monumentales de las cuales esta obra considero que es la mejor.

El detallismo de Judt llega al punto de mencionar por ejemplo que algunas de las primeras obras de Monty Python fueron producidas por Led Zeppelin o analizar los efectos psicológicos del urbanismo de posguerra pero por hacer una breve reseña de las impresiones que me deja el libro mencionaré solamente 3: desmemoria, continuidad y Alemania.

Desmemoria que toda la historia demuestra. Por parte de Alemania que no quiso verse a sí misma más que como victima de la contienda en lugar de la provocadora. Un botón de muestra: La desnazificación obligaba a los alemanes a ver peliculas con sus actos antes de tener acceso a las cartillas de racionamiento de los aliados y gran parte de la platea se pasaba la proyección con los ojos cerrados. Miraron a otro lado antes, durante y después.

Continuidad. Los miembros de la Gestapo pasaron en su mayoria a engrosar los cuadros de la policía soviética y una vez caído el comunismo pasaron a ser los nuevos líderes de las democracias del este. Sin solución de continuidad.

Alemania. Alemania como eterno problema en el corazón de Europa. Alemania y lo Alemán como causa de los sufrimientos del resto de Europa. Cosa que como vemos, sigue sin solucionarse.

Estupidiario y otras cosas | jomaweb | 0 Comentarios | Enlace


2015-04-02

EL ARTE Y LA CIENCIA DE NO HACER NADA, de Andrew J. Smart



Delicioso breve ensayo que defiende la necesidad de mantener prolongados estados de inactividad para una vida creativa y plena. No solo eso, sino que la ausencia de tiempo libre haciendo básicamente nada es la fuente de muchas de las patologías actuales. Ansiedad, depresión, TDAH en niños, todos ellos podrían mejorarse con una atención al estrés al que nos sometemos a diario. La multiactividad no es buena. Las listas de tareas y los métodos de productividad personal nos hacen infelices y enfermos.

Smart sin saberlo y sin mencionarlo en ningún caso forma parte de la corriente Slow que parece estar en boga en determinados ambientes. Slow life, slow food, slow cities. Disfrutar mas de nuestro día a día, sin prisa, es el fundamento de una vida plena.

Una gran diatriba desde la neurociencia contra lo que Smart denomina "la industria de la administración del tiempo"

Estupidiario y otras cosas | jomaweb | 0 Comentarios | Enlace


2015-03-22

EL ANIMAL SOCIAL, de David Brooks



Original planteamiento para mostrar los consensos más válidos en la actualidad sobre la psicología de las relaciones humanas. Como si una novela se tratase, Brooks narra la historia de una pareja, su infancia, su educación, su enamoramiento, su descendencia...siempre atendiendo a lo que la ciencia sabe en la actualidad en términos de neurología y psicología social.

Buena forma de introducirte en este apasionante mundo, aunque si eres psicólogo o tienes amplios conocimientos de la materia, el libro se te queda corto.

Recomendable

Estupidiario y otras cosas | jomaweb | 0 Comentarios | Enlace


2015-02-23

LA SEÑAL Y EL RUIDO, de Nate Silver



Ensayo breve y quizás algo superficial sobre cómo la estadística se puede aplicar a situaciones de la vida cotidiana. Desde las estadísticas de beisbol hasta los modelos matemáticos para la predicción de huracanes Silver desgrana las diferencias entre señal y ruido, cómo distinguir la información válida de la que no lo es, cómo la lógica bayesiana puede ayudarnos a predecir la gravedad de los terremotos o incluso de los atentados terroristas.

Sin embargo no puedo evitar desaconsejar el libro si tienes conocimientos de estadística o probabilidad, dado que el tratamiento de los temas es a mi juicio superficial y no entra demasiado a fondo en cada uno de los temas, siendo más un ensayo divulgativo para personas que no tienen idea de estadística que otra cosa.

Recomendable dependiendo de tu nivel.

Estupidiario y otras cosas | jomaweb | 2 Comentarios | Enlace